赞
踩
作者:陈熹
来源:早起Python
大家好,在之前的办公自动化系列文章中我们已经详细介绍了如何使用python批量处理PDF文件,包括合并、拆分、水印、加密等操作。
今天我们再次回到PDF,详细讲解如何使用python从PDF提取指定的信息。我们将以一份年度报告PDF为例进行介绍,内含大量文字、表格、图片,具体如下
模块安装
首先需要安装两个模块,第一个是pdfplumber,在命令行使用pip安装即可
pip install pdfplumber
第二个是fitz, 它是pymupdf中的一个模块,同样可以使用pip轻松安装
pip install pymupdf
文字信息提取
使用python提取PDF中文字代码思
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。