当前位置:   article > 正文

python根据多个文件名的关键词批量查找文件_python从excel表格中查找关键字,从并从批量文件中检索出对应关键字

python从excel表格中查找关键字,从并从批量文件中检索出对应关键字

老板给了我一个文件列表中,只有关键词,让我在一堆文件中把这些带有关键词的挑出来,并且统计关键词出现的次数。
我先做了类似的文件测试一下,一个名为filename的excel表
filename

又做了一个文件夹
myfiles

接下来运行代码

import os
import numpy as np
import pandas as pd
import shutil

file_path='/home/disk/yh_test/myfiles'  #文件路径
filename_path='/home/disk/yh_test/filename.xlsx'  #文件列表

filelist=os.listdir(file_path)        #获取文件夹中的文件名称
file_name=pd.read_excel(filename_path)   #读取所需文件列表

file_name['count']=0    #定义新的一列count,用于计数
for file in filelist:
    m=file_name.shape[0]   #表格的行数
    olddir=os.path.join(file_path,file) #每一个文件路径
    for i in range(m):
        if str(file_name['name'][i]) in file:   #寻找对应的文件名
            F="/home/disk/yh_test/myfiles_filter/"  #新文件夹名称(先建好)
            newdir=os.path.join(F,file)
            shutil.copy(olddir,newdir)      #复制到新文件夹中
            file_name['count'][i]=file_name['count'][i]+1   #计数
            print(file)  #打印出文件名,其实我是为了看它是不是在运行
        else:
            continue

file_name.to_excel('file_name_count.xlsx')        #保存新的文件列表

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27

运行结果如下:
在这里插入图片描述
新的文件夹myfiles_filter中文件是这样的:
在这里插入图片描述有关键字的文件都被复制过来了。
count
新的列表里就有关键字出现的次数。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/319420
推荐阅读
相关标签
  

闽ICP备14008679号