当前位置:   article > 正文

python如何提取word文档某个段落所有内容(包括段落、表格、图片一并提取)_用python把word某段文字

用python把word某段文字

这里写自定义目录标题


原版链接:
https://blog.csdn.net/weixin_53366160/article/details/125921523
实现方法:找到所需文档用的起始光标和结束光标,然后进行复制即可。
浅说一下这里:

用代码 search_range.Find.Execute(FindText=“标题一”)查找到标题一
再用search_range.Select()选取标题一
最后 word.Selection.MoveLeft()光标左移
start = word.Selection.Start.numerator找到位置

# 光标start的查找
# 赋值对象
search_range = doc.Content
# 查找内容
search_range.Find.Execute(FindText="标题一")
# 选中查找到的内容
search_range.Select()
# 光标左移
word.Selection.MoveLeft()
# 将光标位置赋予start
start = word.Selection.Start.numerator
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

全部代码如下:

import win32com.client as win32
from win32com.client import constants
import os
# 打开word应用程序
word = win32.gencache.EnsureDispatch('Word.Application')
# 是否可视化
word.Visible = 0
# 源文件路径
file_path = r'D:/源文件/A.docx'
# 打开
doc = word.Documents.Open(file_path)
# 光标start的查找
# 赋值对象
search_range = doc.Content
# 查找内容
search_range.Find.Execute(FindText="标题一")
# 选中查找到的内容
search_range.Select()
# 光标左移
word.Selection.MoveLeft()
# 将光标位置赋予start
start = word.Selection.Start.numerator
print(start)
 
# 光标end的查找  同上
search_range = doc.Content
search_range.Find.Execute(FindText="标题二")
search_range.Select()
word.Selection.MoveLeft()
end = word.Selection.Start.numerator
print(end)
 
# 选取光标start到光标end的内容
doc.Range(start, end).Select()
# 复制
word.Selection.Copy()
# 粘贴的目标文件
doc_new = word.Documents.Open('D:/目标文件/B.docx')
# 粘贴
doc_new.Application.ActiveDocument.Range().Paste()
# 关闭两个文件
doc_new.Close()
doc.Close()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/281803
推荐阅读
相关标签
  

闽ICP备14008679号