当前位置:   article > 正文

Python小工具:提取PDF表格中的指定内容到Excel_python如何把pdf里面的多个表格转化成对应行列的excel

python如何把pdf里面的多个表格转化成对应行列的excel

1 思路

  1. 首先找到Python关于PDF的相关包
  2. 通过库文件对PDF的每一页进行遍历
  3. 对PDF的每一个表格进行遍历
  4. 对表格中的每一项进行遍历,找到自己需要提取的那一项
  5. 通过if判断语句,对符合自己选择条件的内容进行输出
    注意:这个无法提取扫描版PDF中的表格

2 详细代码

import xlwt
import pdfplumber

# 定义保存Excel的位置
workbook = xlwt.Workbook()
sheet = workbook.add_sheet("提取内容")

pdf_path = r'path.pdf'
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/878328
推荐阅读
相关标签
  

闽ICP备14008679号