当前位置:   article > 正文

Python批量实现Word、EXCLE、PPT转PDF文件_python ppt转pdf

python ppt转pdf

 一、绪论背景

        在日常办公和文档处理中,有时我们需要将多个Word文档、Excel表格或PPT演示文稿转换为PDF文件。将文档转换为PDF格式的好处是它可以保留文档的布局和格式,并且可以在不同平台上进行方便的查看和共享。

        本篇博文将介绍如何使用Python编程语言批量实现将多个Word、Excel和PPT文件转换为PDF文件。我们将通过使用Python第三方库来读取、编辑和保存这些文档,并使用合适的转换工具将它们转换为PDF格式。

        具体实现方面,我们将首先安装所需的Python库和相关软件,主要使用三个库函数:os, win32com.client, gc。

  1)osos 是Python内置的一个与操作系统交互的库。它提供了许多用于处理文件和目录的函数,例如创建、删除、重命名文件或目录,获取文件属性,遍历目录等。通过使用 os 库,我们可以在Python程序中执行各种与操作系统相关的任务。

  2)win32com.clientwin32com.client 是一个用于与Windows平台上的COM组件进行交互的Python库。COM(Component Object Model)是一种面向对象的组件技术,允许不同的应用程序之间进行通信和交互。win32com.client 库提供了一种方便的方式来调用和操作COM组件,如Microsoft Office应用程序(Word、Excel、PowerPoint等)。通过这个库,我们可以自动化执行一些Office任务,如读写文档、操作Excel表格、创建PPT演示文稿等。

  3)gcgc 是Python内置的垃圾回收模块。垃圾回收是指在程序执行过程中,自动检测和回收不再使用的内存空间,以提高内存利用率和程序性能。gc 模块为我们提供了一些功能,如手动触发垃圾回收、获取和设置垃圾回收的阈值等。尽管Python有自动的垃圾回收机制,但在某些情况下,我们可能需要手动控制垃圾回收的行为。

        然后,我们将编写Python代码来遍历指定文件夹中的所有文档,并对每个文档进行逐个转换。

        最后,我们将保存转换后的PDF文件到指定的目录中。

        通过阅读本篇博文,你将学习到如何使用Python编程语言批量实现将多个Word、Excel和PPT文件转换为PDF文件的方法。这将为你提供一种自动化的方式来处理文档转换任务,节省时间和精力,并提高工作效率。

        无论你是一位办公人员、学生还是有大量文档需要处理的个人用户,本篇教程都将帮助你掌握如何使用Python批量实现Word、Excel和PPT转换为PDF文件。让我们一起开始这个方便实用的文档处理之旅吧!

二、代码实践

   大家运行本代码,只需要更改为自己的路径即可。如代码中我的地址:D:\Pycharmproject2023\code_test_project\shan_test\data,改为你本地地址即可。

  1. import os, win32com.client, gc
  2. # Word
  3. def word2Pdf(filePath, words):
  4. # 如果没有文件则提示后直接退出
  5. if (len(words) < 1):
  6. print("\n【无 Word 文件】\n")
  7. return
  8. # 开始转换
  9. print("\n【开始 Word -> PDF 转换】")
  10. try:
  11. print("打开 Word 进程...")
  12. word = win32com.client.Dispatch("Word.Application")
  13. word.Visible = 0
  14. word.DisplayAlerts = False
  15. doc = None
  16. for i in range(len(words)):
  17. print(i)
  18. fileName = words[i] # 文件名称
  19. fromFile = os.path.join(filePath, fileName) # 文件地址
  20. toFileName = changeSufix2Pdf(fileName) # 生成的文件名称
  21. toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
  22. print("转换:" + fileName + "文件中...")
  23. # 某文件出错不影响其他文件打印
  24. try:
  25. doc = word.Documents.Open(fromFile)
  26. doc.SaveAs(toFile, 17) # 生成的所有 PDF 都会在 PDF 文件夹中
  27. print("转换到:" + toFileName + "完成")
  28. except Exception as e:
  29. print(e)
  30. # 关闭 Word 进程
  31. print("所有 Word 文件已打印完毕")
  32. print("结束 Word 进程...\n")
  33. doc.Close()
  34. doc = None
  35. word.Quit()
  36. word = None
  37. except Exception as e:
  38. print(e)
  39. finally:
  40. gc.collect()
  41. # Excel
  42. def excel2Pdf(filePath, excels):
  43. # 如果没有文件则提示后直接退出
  44. if (len(excels) < 1):
  45. print("\n【无 Excel 文件】\n")
  46. return
  47. # 开始转换
  48. print("\n【开始 Excel -> PDF 转换】")
  49. try:
  50. print("打开 Excel 进程中...")
  51. excel = win32com.client.Dispatch("Excel.Application")
  52. excel.Visible = 0
  53. excel.DisplayAlerts = False
  54. wb = None
  55. ws = None
  56. for i in range(len(excels)):
  57. print(i)
  58. fileName = excels[i] # 文件名称
  59. fromFile = os.path.join(filePath, fileName) # 文件地址
  60. print("转换:" + fileName + "文件中...")
  61. # 某文件出错不影响其他文件打印
  62. try:
  63. wb = excel.Workbooks.Open(fromFile)
  64. for j in range(wb.Worksheets.Count): # 工作表数量,一个工作簿可能有多张工作表
  65. toFileName = addWorksheetsOrder(fileName, j + 1) # 生成的文件名称
  66. toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
  67. ws = wb.Worksheets(j + 1) # 若为[0]则打包后会提示越界
  68. ws.ExportAsFixedFormat(0, toFile) # 每一张都需要打印
  69. print("转换至:" + toFileName + "文件完成")
  70. except Exception as e:
  71. print(e)
  72. # 关闭 Excel 进程
  73. print("所有 Excel 文件已打印完毕")
  74. print("结束 Excel 进程中...\n")
  75. ws = None
  76. wb.Close()
  77. wb = None
  78. excel.Quit()
  79. excel = None
  80. except Exception as e:
  81. print(e)
  82. finally:
  83. gc.collect()
  84. # PPT
  85. def ppt2Pdf(filePath, ppts):
  86. # 如果没有文件则提示后直接退出
  87. if (len(ppts) < 1):
  88. print("\n【无 PPT 文件】\n")
  89. return
  90. # 开始转换
  91. print("\n【开始 PPT -> PDF 转换】")
  92. try:
  93. print("打开 PowerPoint 进程中...")
  94. powerpoint = win32com.client.Dispatch("PowerPoint.Application")
  95. ppt = None
  96. # 某文件出错不影响其他文件打印
  97. for i in range(len(ppts)):
  98. print(i)
  99. fileName = ppts[i] # 文件名称
  100. fromFile = os.path.join(filePath, fileName) # 文件地址
  101. toFileName = changeSufix2Pdf(fileName) # 生成的文件名称
  102. toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
  103. print("转换:" + fileName + "文件中...")
  104. try:
  105. ppt = powerpoint.Presentations.Open(fromFile, WithWindow=False)
  106. if ppt.Slides.Count > 0:
  107. ppt.SaveAs(toFile, 32) # 如果为空则会跳出提示框(暂时没有找到消除办法)
  108. print("转换至:" + toFileName + "文件完成")
  109. else:
  110. print("(错误,发生意外:此文件为空,跳过此文件)")
  111. except Exception as e:
  112. print(e)
  113. # 关闭 PPT 进程
  114. print("所有 PPT 文件已打印完毕")
  115. print("结束 PowerPoint 进程中...\n")
  116. ppt.Close()
  117. ppt = None
  118. powerpoint.Quit()
  119. powerpoint = None
  120. except Exception as e:
  121. print(e)
  122. finally:
  123. gc.collect()
  124. # 修改后缀名
  125. def changeSufix2Pdf(file):
  126. return file[:file.rfind('.')] + ".pdf"
  127. # 添加工作簿序号
  128. def addWorksheetsOrder(file, i):
  129. return file[:file.rfind('.')] + "_工作表" + str(i) + ".pdf"
  130. # 转换地址
  131. def toFileJoin(filePath, file):
  132. return os.path.join(filePath, 'pdf', file[:file.rfind('.')] + ".pdf")
  133. # 开始程序
  134. print("====================程序开始====================")
  135. print(
  136. "【程序功能】将目标路径下内所有的 ppt、excel、word 均生成一份对应的 PDF 文件,存在新生成的 pdf 文件夹中(需已经安装office,不包括子文件夹)")
  137. print(
  138. "注意:若某 PPT 和 Excel 文件为空,则会出错跳过此文件。若转换 PPT 时间过长,请查看是否有报错窗口等待确认,暂时无法彻底解决 PPT 的窗口问题(为空错误已解决)。在关闭进程过程中,时间可能会较长,十秒左右,请耐心等待。")
  139. # 需要转换的文件路径
  140. # filePath = input("输入目标路径:(若为当前路径:" + os.getcwd() + ",请直接回车)\n")
  141. filePath = "D:\Pycharmproject2023\code_test_project\shan_test\data"
  142. # 目标路径,若没有输入路径则为当前路径
  143. if (filePath == ""):
  144. filePath = os.getcwd()
  145. # 将目标文件夹所有文件归类,转换时只打开一个进程
  146. words = []
  147. ppts = []
  148. excels = []
  149. for fn in os.listdir(filePath):
  150. if fn.endswith(('.doc', 'docx')):
  151. words.append(fn)
  152. if fn.endswith(('.ppt', 'pptx')):
  153. ppts.append(fn)
  154. if fn.endswith(('.xls', 'xlsx')):
  155. excels.append(fn)
  156. # 调用方法
  157. print("====================开始转换====================")
  158. # 保存路径:新建 pdf 文件夹,所有生成的 PDF 文件都放在里面
  159. folder = filePath + '\\pdf\\'
  160. if not os.path.exists(folder):
  161. os.makedirs(folder)
  162. word2Pdf(filePath, words)
  163. excel2Pdf(filePath, excels)
  164. ppt2Pdf(filePath, ppts)
  165. print("====================转换结束====================")
  166. print("\n====================程序结束====================")
  167. # os.system("pause")

三、实践效果

 大家可以自己在本地新建几个文件,试试效果,体验一下把!

参考链接:http://blog.csdn.net/qq_57187936/article/details/125606165

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/69472
推荐阅读
相关标签
  

闽ICP备14008679号