Python 3.0_按条件批量读取文件

发表: 2018-04-26 浏览: 1292

Python

读取需求

一级路径下有多个二级路径，只需读取一级路径下的部分文件或二级路径中的文件，且需要根据文件名中的关键词对文件进行分类，并读取到对应的list中。

读取代码

#!/usr/bin/env python

# -*- coding: utf-8 -*-



import re

import os



def eachfile(path, dltroot, dltfile, splitlist):

    """

    :param path: 文件存储的一级路径

    :param dltroot: 不需要读取的二级路径

    :param dltfile: 不需要读取的文件

    :param splitlist：对文件进行二分类的关键词

    :return: 分类读取的文件所存储的list

    """

    kw1 = []        #新建空列表                                                                        

    kw2 = []        #新建空列表

    for root, dirs, files in os.walk(path):

    """        

    os.walk: 输入一个路径名称，以yield的方式（其实是一个生成器）返回一个三元组 dirpath, dirnames, filenames

    dirpath: 返回一级路径下的所有路径，包括一级路径本身，如 C:\Users\Administrator\Desktop\file

    dirnames: 返回一级路径下面所有存在的目录的名称，如 C:\Users\Administrator\Desktop\file下面有两个目录：file1和file2，那么它就列出了这个一级路径下的目录名称，分别为file1和file2

    filenames: 返回一级路径下面所有文件的名称，如 C:\Users\Administrator\Desktop\file下面有两个文件file_test1.txt和file_test2 .txt，那么程序将会列出这两个文件名

    """

        if root not in dltroot:                          #判断是否是需要读取的路径

            for file in files:

                if file not in dltfile:                  #判断是否是需要读取的的文件

                    filepath = root + '\\' + file        #生成最终需要读取的文件的绝对路径

                    if os.path.splitext(file)[0][-2:] in splitlist:        #os.path.splitext用于分离文件名与扩展名，os.path.splitext(file)[0]返回文件名，使用文件名最后的两个字作为分类的关键词

                        with open(filepath, encoding='UTF-8') as file:     #读取分类后的文件并写入列表

                            for l in file:

                                l = l.strip()

                                kw1.append(l.lower())

                    else:

                        with open(filepath, encoding='UTF-8') as file:

                            for l in file:

                                l = l.strip()

                                kw2.append(l.lower())

    return kw1, kw2

参考链接

https://www.cnblogs.com/jiaxin359/p/7324077.html

0 个评论

要回复文章请先登录或注册