当前位置:   article > 正文

史上最全的Python操作 “PPT” 文档大全,以后写“数据分析报告”靠她了!

python 提取pptx各个slide的各个shape 继承自母版字体信息

↑↑↑关注后"星标"简说Python

人人都可以简单入门Python、爬虫、数据分析

 简说Python严选 

来源:数据分析与统计学之美    作者:黄伟呢

One old watch, like brief python

大家好,我是老表~

今天和大家分享的内容是Python自动化之Python操作PPT系列,学习了记得点赞、留言、转发,三连哦~

1、python-pptx模块简介

使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。

这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。

  • 可以创建、修改PPT(.pptx)文件

  • 需要单独安装,不包含在Python标准模块里

  • python-pptx官网介绍:https://python-pptx.readthedocs.io/en/latest/

2、模块的安装与导入

1)模块的安装
  1. "Windows用户命令行下输入"
  2. pip install python-pptx
  3. "Mac用户命令行下输入"
  4. pip3 install python-pptx
2)模块的导入

这里有一点需要注意的是:安装的库是python-pptx,但是导入的时候却有点不同。

import pptx

3、python读取PPT文档中的内容

1)PPT的结构说明

在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。

关于run块儿的概念,可以参考我的另外一篇文章:https://blog.csdn.net/weixin_41261833/article/details/106028038

2)获取Slide
  1. from pptx import Presentation
  2. prs = Presentation("统计学习方法PPT.pptx")
  3. for slide in prs.slides:
  4.     print(slide)

结果如下:

3)获取Shape形状
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("统计学习方法PPT.pptx")
  4. for slide in prs.slides:
  5.     for shape in slide.shapes:
  6.         print(shape)
  7. """
  8. 注意:这里得到的Shape对象,并不能看出什么,接着往下看。
  9. """

结果如下:

4)判断每个Shape中是否存在文字
  • shape.has_text_frame :是否有文字

  • shape.text_frame :获取文字框

  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("统计学习方法PPT.pptx")
  4. for slide in prs.slides:
  5.     for shape in slide.shapes:
  6.         if shape.has_text_frame:
  7.             text_frame = shape.text_frame
  8.             print(text_frame.text)

结果如下:

5)获取某一页Slide中的内容
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("统计学习方法PPT.pptx")
  4. for i,slide in enumerate(prs.slides):
  5.     if i == 5:
  6.         for shape in slide.shapes:
  7.             if shape.has_text_frame:
  8.                 text_frame = shape.text_frame
  9.                 print(text_frame.text)

结果如下:

6)获取Shape中的某个Paragraph
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("统计学习方法PPT.pptx")
  4. for i,slide in enumerate(prs.slides):
  5.     if i == 5:
  6.         for shape in slide.shapes:
  7.             if shape.has_text_frame:
  8.                 text_frame = shape.text_frame
  9.                 for paragraph in text_frame.paragraphs:
  10.                     print(paragraph.text)
  11. """
  12. 注意:该方法和上述4)中的方法一摸一样。上述方法是直接获取Shpae中的文字内容;
  13. 下面这个更灵活,先获取每个Shape,然后在获取每个Shape中的paragraph;
  14. 下面方式更好:因为我们可以针对paragraph,写一个判断条件,只获取第几个paragraph;
  15. """

结果如下:

4、利用python像PPT中写入内容

1)幻灯片模板及占位符的概念
2)怎么自定义母版?

https://jingyan.baidu.com/article/925f8cb8b5dfe7c0dce05671.html

3)什么是版式?

这个概念在下面的效果中,会得以体现。其中prs.slide_layouts[]传入0表示获取的是第一个版式,传入1表示获取的是第二个版式,以此类推下去。

4)添加Slide和内容

这里就需要使用上述的自定义母版。因为毕竟是使用python操作PPT,我们可以定义好自己想要展示的PPT母版,然后借助代码完成PPT的内容写入操作。

① 占位符id的确认
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("空白.pptx")
  4. # prs.slide_layouts[]表示的是ppt中不同的版式
  5. slide = prs.slides.add_slide(prs.slide_layouts[0])
  6. for shape in slide.placeholders:
  7.     phf = shape.placeholder_format
  8.     print(f"{phf.idx}--{shape.name}--{phf.type}")
  9.     shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
  10. # 注意:做完这个操作,一定要记得保存一下!
  11. prs.save("电子奖状模板.pptx")
  12. """
  13. 上述打印结果如下:
  14. 0--Title 1--TITLE (1)  这个表示标题占位符,id为0
  15. 13--Picture Placeholder 2--PICTURE (18)  这个表示图片占位符,id为13
  16. 14--Text Placeholder 3--BODY (2)  这个表示正文内容占位符,id为14
  17. 15--Text Placeholder 4--BODY (2)  这个表示正文内容占位符,id为15
  18. 我们一定要先知道每个空格的占位符id,才可以进行下面内容的填充。
  19. """

效果如下:

② PPT内容的填写
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("空白.pptx")
  4. slide = prs.slides.add_slide(prs.slide_layouts[0])
  5. name = slide.placeholders[14]
  6. why = slide.placeholders[15]
  7. name.text = "黄同学"
  8. why.text = "学习太积极"
  9. prs.save("内容填充.pptx")

效果如下:

5)添加段落
① 占位符id的确认
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("finall.pptx")
  4. slide = prs.slides.add_slide(prs.slide_layouts[0])
  5. for shape in slide.placeholders:
  6.     phf = shape.placeholder_format
  7.     print(f"{phf.idx}--{shape.name}--{phf.type}")
  8.     shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
  9. print("-------------------------------------------")
  10. slide = prs.slides.add_slide(prs.slide_layouts[1])
  11. for shape in slide.placeholders:
  12.     phf = shape.placeholder_format
  13.     print(f"{phf.idx}--{shape.name}--{phf.type}")
  14.     shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
  15. prs.save("哈哈.pptx")

效果如下:

② 段落的添加
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("finall.pptx")
  4. slide = prs.slides.add_slide(prs.slide_layouts[0])
  5. name = slide.placeholders[14]
  6. why = slide.placeholders[15]
  7. name.text = "黄同学"
  8. why.text = "学习太积极"
  9. # --------------------------------------------------- #
  10. prs1 = Presentation("finall.pptx")
  11. slide1 = prs.slides.add_slide(prs.slide_layouts[1])
  12. shapes = slide1.shapes
  13. title_shape = shapes.title  # 这句代码可以改为title_shape = shapes.placeholders[0]
  14. body_shape = shapes.placeholders[1]
  15. title_shape.text = "这是一个标题"
  16. tf = body_shape.text_frame
  17. # 这句代码就是给body占位符添加内容!
  18. tf.text = "带圆点的符号1"
  19. p = tf.add_paragraph()
  20. # 这个代码表示在原来的基础上,添加第一个段落!
  21. p.text = "带圆点的符号2"
  22. p = tf.add_paragraph()
  23. # 这个代码表示在原来的基础上,添加第二个段落!
  24. p.text = "带圆点的符号3"
  25. prs.save("嘿嘿.pptx")

效果如下:

③ 给段落设定层级关系
  1. import pptx
  2. from pptx import Presentation
  3. prs = Presentation("finall.pptx")
  4. slide = prs.slides.add_slide(prs.slide_layouts[0])
  5. name = slide.placeholders[14]
  6. why = slide.placeholders[15]
  7. name.text = "黄同学"
  8. why.text = "学习太积极"
  9. # --------------------------------------------------- #
  10. prs1 = Presentation("finall.pptx")
  11. slide1 = prs.slides.add_slide(prs.slide_layouts[1])
  12. shapes = slide1.shapes
  13. title_shape = shapes.title  # 这句代码可以改为title_shape = shapes.placeholders[0]
  14. body_shape = shapes.placeholders[1]
  15. title_shape.text = "这是一个标题"
  16. tf = body_shape.text_frame
  17. tf.text = "带圆点的符号1"
  18. p = tf.add_paragraph()
  19. p.text = "带圆点的符号2"
  20. # 原始内容的层级相当于是0,因此这个段落我设置为层级1,下面的段落设置为层级2
  21. p.level = 1
  22. p = tf.add_paragraph()
  23. p.text = "带圆点的符号3"
  24. p.level = 2
  25. prs.save("嘻嘻.pptx")

效果如下:

④ 添加一个文本框
  • slide.shapes.add_textbox(left, top, width, height)

  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. prs = Presentation()
  4. # 使用第一个版式
  5. black_slide_layout = prs.slide_layouts[0]
  6. slide = prs.slides.add_slide(black_slide_layout)
  7. left = top = width = height = Cm(3)
  8. text_box = slide.shapes.add_textbox(left, top, width, height)
  9. tf = text_box.text_frame
  10. tf.text = "这是一段文本框里面的文字"
  11. p = tf.add_paragraph()
  12. p.text = "这是第二段文字,加粗,字号40"
  13. p.font.bold = True
  14. p.font.size = Pt(40)
  15. prs.save("添加一个文本框0.pptx")

效果如下:

⑤ 添加一个图片
  • slide.shapes.add_picture(图片路径, 距离左边, 距离顶端, 宽度, 高度)

第一种展示:

  1. from pptx import Presentation
  2. from pptx.util import Cm
  3. prs = Presentation()
  4. # 使用第七个版式
  5. black_slide_layout = prs.slide_layouts[6]
  6. slide = prs.slides.add_slide(black_slide_layout)
  7. left = top = Cm(3)
  8. pic = slide.shapes.add_picture("孙悟空.png", left, top)
  9. prs.save("添加图片1.pptx")

效果如下:

第二种展示:

  1. from pptx import Presentation
  2. from pptx.util import Cm
  3. prs = Presentation()
  4. # 使用第七个版式
  5. black_slide_layout = prs.slide_layouts[6]
  6. slide = prs.slides.add_slide(black_slide_layout)
  7. left = top = Cm(3)
  8. height = Cm(5.5)
  9. pic = slide.shapes.add_picture("孙悟空.png", left, top, height=height)
  10. prs.save("添加图片2.pptx")

效果如下:

⑥ 添加表格
  • shapes.add_table(rows, cols, left, top, width, height)

  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. prs = Presentation()
  4. # 使用第七个版式
  5. black_slide_layout = prs.slide_layouts[6]
  6. slide = prs.slides.add_slide(black_slide_layout)
  7. shapes = slide.shapes
  8. rows, cols = 53
  9. left = top = Cm(5)
  10. width = Cm(18)
  11. height = Cm(3)
  12. table = shapes.add_table(rows, cols, left, top, width, height).table
  13. table.columns[0].width = Cm(6)
  14. table.columns[1].width = Cm(2)
  15. table.columns[2].width = Cm(2)
  16. table.rows[0].height = Cm(2)
  17. data = [
  18.     ["姓名","性别","成绩"],
  19.     ["张三","男",96],
  20.     ["李四","女",87],
  21.     ["王五","女",90],
  22.     ["赵六","男",78]
  23. ]
  24. for row in range(rows):
  25.     for col in range(cols):
  26.         table.cell(row,col).text = str(data[row][col])
  27. prs.save("插入表格.pptx")  

结果如下:

5、PPT文档内容样式批量调整

1)文本框位置的调整

上面我们已经知道怎么添加文本框,现在我们需要做的就是,怎么调整文本框的位置。

  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
  4. prs = Presentation()
  5. # 使用第七个版式
  6. black_slide_layout = prs.slide_layouts[6]
  7. slide = prs.slides.add_slide(black_slide_layout)
  8. left = top = width = height = Cm(3)
  9. text_box = slide.shapes.add_textbox(left, top, width, height)
  10. tf = text_box.text_frame
  11. tf.text = "这是一段文本框里面的文字"
  12. # ----------------------------------------- #
  13. tf.margin_bottom = Cm(0.1) # 下边距
  14. tf.margin_left = 0 # 下边距
  15. # 一定要导入MSO_ANCHOR这个库
  16. tf.vertical_anchor = MSO_ANCHOR.BOTTOM # 对齐文本方式:底端对齐
  17. tf.word_wrap = True # 框中的文字自动换行
  18. prs.save("文本框样式的调整.pptx")  

结果如下:

2)文本框背景颜色调整
  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
  4. from pptx.dml.color import RGBColor
  5. prs = Presentation()
  6. # 使用第七个版式
  7. black_slide_layout = prs.slide_layouts[6]
  8. slide = prs.slides.add_slide(black_slide_layout)
  9. left = top = width = height = Cm(3)
  10. text_box = slide.shapes.add_textbox(left, top, width, height)
  11. tf = text_box.text_frame
  12. tf.text = "这是一段文本框里面的文字"
  13. # -------------------------------------- #
  14. tf.margin_bottom = Cm(0.1) # 下边距
  15. tf.margin_left = 0 # 下边距
  16. tf.vertical_anchor = MSO_ANCHOR.BOTTOM  
  17. tf.word_wrap = True # 框中的文字自动换行
  18. # -------------------------------------- #
  19. fill = text_box.fill
  20. fill.solid()
  21. # 使用之前一定要导入RGBColor这个库
  22. fill.fore_color.rgb = RGBColor(24715070)
  23. prs.save("文本框背景色的调整.pptx")  

结果如下:

3)文本框边框样式调整
  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
  4. from pptx.dml.color import RGBColor
  5. prs = Presentation()
  6. # 使用第七个版式
  7. black_slide_layout = prs.slide_layouts[6]
  8. slide = prs.slides.add_slide(black_slide_layout)
  9. left = top = width = height = Cm(3)
  10. text_box = slide.shapes.add_textbox(left, top, width, height)
  11. tf = text_box.text_frame
  12. tf.text = "这是一段文本框里面的文字"
  13. # -------------------------------------- #
  14. tf.margin_bottom = Cm(0.1) # 下边距
  15. tf.margin_left = 0 # 下边距
  16. tf.vertical_anchor = MSO_ANCHOR.BOTTOM  
  17. tf.word_wrap = True # 框中的文字自动换行
  18. # -------------------------------------- #
  19. fill = text_box.fill
  20. fill.solid()
  21. # 使用之前一定要导入RGBColor这个库
  22. fill.fore_color.rgb = RGBColor(24715070)
  23. # -------------------------------------- #
  24. line = text_box.line
  25. line.color.rgb = RGBColor(25500)
  26. line.width = Cm(0.3)
  27. prs.save("文本框边框样式调整.pptx")  

结果如下:

4)段落对其调整
  1. from pptx import Presentation
  2. from pptx.enum.text import PP_ALIGN
  3. prs = Presentation()
  4. # 使用第七个版式
  5. black_slide_layout = prs.slide_layouts[6]
  6. slide = prs.slides.add_slide(black_slide_layout)
  7. left = top = width = height = Cm(3)
  8. text_box = slide.shapes.add_textbox(left, top, width, height)
  9. tf = text_box.text_frame
  10. # ---------------------------- #
  11. p = tf.add_paragraph()
  12. p.text = "这是第二段文字"
  13. p.alignment = PP_ALIGN.LEFT
  14. prs.save("段落对其调整.pptx")  

当然这里还有一些其他样式的调整,和word很类似,就不一一叙述了。

5)字体样式调整

代码如下:

  1. from pptx import Presentation
  2. from pptx.util import Cm, Pt
  3. from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
  4. from pptx.dml.color import RGBColor
  5. from pptx.enum.text import PP_ALIGN
  6. prs = Presentation()
  7. # 使用第七个版式
  8. black_slide_layout = prs.slide_layouts[6]
  9. slide = prs.slides.add_slide(black_slide_layout)
  10. left = top = width = height = Cm(3)
  11. text_box = slide.shapes.add_textbox(left, top, width, height)
  12. tf = text_box.text_frame
  13. # ---------------------------- #
  14. p = tf.add_paragraph()
  15. p.text = "这是第二段文字"
  16. p.alignment = PP_ALIGN.LEFT
  17. # ------------------------------------- #
  18. p.font.bold = True
  19. p.font.name = "宋体"
  20. p.font.color.rgb = RGBColor(24715070)
  21. p.font.size = Pt(30)
  22. prs.save("字体样式调整.pptx")  

结果如下:

文中的素材大家可以回复自动化获取Python自动化办公手册

  1. 【留言赠书】扫码关注下方公众号简说Java,在公众号简说Java私聊回复:老表666,第18个回复的读者将获得《R语言数据分析与可视化从入门到精通》一本。
  2. 长按扫码关注,一起学Java
声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号