当前位置:   article > 正文

python自动化:批量自动提取pdf文件中的照片文件(附完整源码)_pdf 文件中的图片如何获得 python

pdf 文件中的图片如何获得 python

python自动化:批量自动提取pdf文件中的照片文件

以下是一个示例 Python 脚本,用于批量自动提取 PDF 文件中的照片文件并保存:

import os
from PyPDF2 import PdfFileReader
from PIL import Image

def extract_images_from_pdf(pdf_path, output_folder):
    """
    从PDF文件中提取图片并保存
    """
    # 检查输出文件夹是否存在,不存在则创建
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    with open(pdf_path, "rb") as f:
        pdf_reader = PdfFileReader(f)
        num_pages = pdf_reader.numPages

        for page_num in range(num_pages):
            page = pdf_reader.getPage(page_num)
            xObject = page['/Resources']['/XObject'].getObject()

            for obj in xObject:
                if xObject[obj]['/Subtype'] == '/Image':
                    size = (xObject[obj]['/Width'], xObject[obj]['/Height'])
                    data = xObject[obj].getData()

                    if xObject[obj][&#
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/741386
推荐阅读
相关标签
  

闽ICP备14008679号