赞
踩
import PyPDF2 import os from tqdm import tqdm # 要搜索的字符 target_string = input('输入你想要找的内容:\n') # 将目标字符转换为小写 target_string_lower = target_string.lower() # 指定包含 PDF 文件的文件夹路径 pdf_folder = r'文件路径' # 遍历文件夹中的所有 PDF 文件 for filename in os.listdir(pdf_folder): if filename.endswith('.pdf'): pdf_path = os.path.join(pdf_folder, filename) with open(pdf_path, 'rb') as pdf_file: reader = PyPDF2.PdfReader(pdf_file) for page_number in tqdm(range(len(reader.pages)), desc=f'正在处理文件 {filename}'): page = reader.pages[page_number] text = page.extract_text() # 将文本字符串转换为小写 text_lower = text.lower() if target_string_lower in text_lower: print(f'在文件 {filename} 的第 {page_number + 1} 页找到了目标字符')
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。