当前位置:   article > 正文

Python 批量将文件夹中的pdf文件转换为图片 fitz

Python 批量将文件夹中的pdf文件转换为图片 fitz

学习工作中,可能碰到需要将多个pdf文件转换为图片的情况,如果是一个pdf,可以用福新、Adobe acrobat等软件进行转换,如果有多个pdf文件,这些软件可能就显得力不从心。下面介绍使用Python的fitz模块进行批量转换:

  • 安装fitz模块
pip install fitz PyMuPDF
  • 1
  • 完整代码:
# ************************************************************************
# _*_coding:utf-8_*_
# Author: Pandas120 (微信)
# Desription: 批量将同一文件夹内的pdf文件转换为图片
# ************************************************************************
import fitz
import os,glob
def convert_page_pic(pdf_path,img_path):
    with fitz.open(pdf_path) as pdf:
        for pg in range(0, pdf.page_count):
            page = pdf[pg]
            # 设置缩放和旋转系数,zoom_x, zoom_y取相同值,表示等比例缩放
            mat = fitz.Matrix(2, 2)
            pm = page.get_pixmap(matrix=mat, alpha=False)
            if pm.width > 2000 or pm.height > 2000:
                pm = page.get_pixmap(matrix=fitz.Matrix(1, 1), alpha=False)
            page_num = pg + 1 
            pm.save('{0}/{1:0>4}.png'.format(img_path,page_num)) 
            
if __name__=="__main__":

    #输入参数
    pdf_folder = 'pdf'  #pdf路径文件夹,最后不要带斜杠
    out_path = 'out_img'  #输出图片路径文件夹,最后不要带斜杠
    #输入参数

    if not os.path.exists(out_path):
        os.mkdir(out_path)
    pdfs = glob.glob(f"{pdf_folder}/*.pdf")
    for pdf_paths in pdfs:        
        filename = os.path.split(pdf_paths)[1].replace('.pdf','')
        out_path_final = f"{out_path}/{filename}"
        if not os.path.exists(out_path_final):
            os.mkdir(out_path_final)
        convert_page_pic(pdf_paths,out_path_final)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/880009
推荐阅读
相关标签
  

闽ICP备14008679号