当前位置:   article > 正文

【Python基础】python使用python-docx操作word

python docx

1、python-docx库介绍

  • 该模块儿可以创建、修改Word(.docx)文件;

  • 此模块儿不属于python标准库,需要单独安装;

  • python-docx使用官网:python-docx官网

  • 我们在安装此模块儿使用的是pip install python-docx,但是在导入的时候是import docx;

2、Python读取Word文档内容
  • 注意:每进行一个操作,必须保存一下,否则等于白做;

1)word文档结构介绍
在这里插入图片描述
2)python-docx提取文字和文字块儿
① python-docx提取文字

有一个这样的docx文件,我们想要提取其中的文字,应该怎么做?代码如下:

  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. print(doc.paragraphs)
  4. for paragraph in doc.paragraphs:
  5. print(paragraph.text)

结果如下:

② python-docx提取文字块儿
  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. print(doc.paragraphs)
  4. paragraph = doc.paragraphs[0]
  5. runs = paragraph.runs
  6. print(runs)
  7. for run in paragraph.runs:
  8. print(run.text)
  9. ------------------------------
  10. paragraph = doc.paragraphs[1]
  11. runs = paragraph.runs
  12. print(runs)
  13. for run in paragraph.runs:
  14. print(run.text)

结果如下:

3)利用Python向Word文档写入内容
① 添加段落
  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. # print(doc.add_heading("一级标题", level=1)) 添加一级标题的时候出错,还没有解决!
  4. paragraph1 = doc.add_paragraph("这是一个段落")
  5. paragraph2 = doc.add_paragraph("这是第二个段落")
  6. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  7. """
  8. 添加段落的时候,赋值给一个变量,方便我们后面进行格式调整;
  9. """

结果如下:

② 添加文字块儿
  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. # 这里相当于输入了一个空格,后面等待着文字输入
  4. paragraph3 = doc.add_paragraph()
  5. paragraph3.add_run("我被加粗了文字块儿").bold = True
  6. paragraph3.add_run(",我是普通文字块儿,")
  7. paragraph3.add_run("我是斜体文字块儿").italic = True
  8. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")

结果如下:

③ 添加一个分页
  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. doc.add_page_break()
  4. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")

结果如下:

④ 添加图片
  1. from docx import Document
  2. from docx.shared import Cm
  3. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  4. doc.add_picture(r"G:\6Tipdm\7python办公自动化\concat_word\sun_wu_kong.png",width=Cm(5),height=Cm(5))
  5. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  6. """
  7. Cm模块,用于设定图片尺寸大小
  8. """

结果如下:

⑤ 添加表格
  1. from docx import Document
  2. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  3. list1 = [
  4. ["姓名","性别","家庭地址"],
  5. ["唐僧","男","湖北省"],
  6. ["孙悟空","男","北京市"],
  7. ["猪八戒","男","广东省"],
  8. ["沙和尚","男","湖南省"]
  9. ]
  10. list2 = [
  11. ["姓名","性别","家庭地址"],
  12. ["貂蝉","女","河北省"],
  13. ["杨贵妃","女","贵州省"],
  14. ["西施","女","山东省"]
  15. ]
  16. table1 = doc.add_table(rows=5,cols=3)
  17. for row in range(5):
  18. cells = table1.rows[row].cells
  19. for col in range(3):
  20. cells[col].text = str(list1[row][col])
  21. doc.add_paragraph("-----------------------------------------------------------")
  22. table2 = doc.add_table(rows=4,cols=3)
  23. for row in range(4):
  24. cells = table2.rows[row].cells
  25. for col in range(3):
  26. cells[col].text = str(list2[row][col])
  27. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")

结果如下:

⑥ 提取word表格,并保存在excel中(很重要)
  1. from docx import Document
  2. from openpyxl import Workbook
  3. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test2.docx")
  4. t0 = doc.tables[0]
  5. workbook = Workbook()
  6. sheet = workbook.active
  7. for i in range(len(t0.rows)):
  8. list1 = []
  9. for j in range(len(t0.columns)):
  10. list1.append(t0.cell(i,j).text)
  11. sheet.append(list1)
  12. workbook.save(filename = r"G:\6Tipdm\7python办公自动化\concat_word\来自word中的表.xlsx")

结果如下:

3、利用Python调整Word文档样式
1)修改文字字体样式
  1. from docx import Document
  2. from docx.shared import Pt,RGBColor
  3. from docx.oxml.ns import qn
  4. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test2.docx")
  5. for paragraph in doc.paragraphs:
  6. for run in paragraph.runs:
  7. run.font.bold = True
  8. run.font.italic = True
  9. run.font.underline = True
  10. run.font.strike = True
  11. run.font.shadow = True
  12. run.font.size = Pt(18)
  13. run.font.color.rgb = RGBColor(255,255,0)
  14. run.font.name = "宋体"
  15. # 设置像宋体这样的中文字体,必须添加下面2行代码
  16. r = run._element.rPr.rFonts
  17. r.set(qn("w:eastAsia"),"宋体")
  18. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\_test1.docx")

结果如下:

2)修改段落样式
① 对齐样式
  1. from docx import Document
  2. from docx.enum.text import WD_ALIGN_PARAGRAPH
  3. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  4. print(doc.paragraphs[0].text)
  5. doc.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
  6. # 这里设置的是居中对齐
  7. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\对齐样式.docx")
  8. """
  9. LEFT,CENTER,RIGHT,JUSTIFY,DISTRIBUTE,JUSTIFY_MED,JUSTIFY_HI,JUSTIFY_LOW,THAI_JUSTIFY
  10. """

结果如下:

② 行间距调整
  1. from docx import Document
  2. from docx.enum.text import WD_ALIGN_PARAGRAPH
  3. doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
  4. for paragraph in doc.paragraphs:
  5. paragraph.paragraph_format.line_spacing = 5.0
  6. doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\行间距.docx")

结果如下:

③ 段前与段后间距
  • 这里提供代码,自行下去检验

在这里插入图片描述

  1. 往期精彩回顾
  2. 适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
  3. AI基础下载机器学习的数学基础专辑
  4. 本站qq群704220115,加入微信群请扫码:
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/660991
推荐阅读
相关标签
  

闽ICP备14008679号