当前位置:   article > 正文

docx转换成txt linux,如何将doc / docx文件转换为markdown或结构化文本?

linux convert docx to markdown

为什么选择转换工具?

虽然Markdown编辑喜欢精彩的iA Writer可以将“从Markdown”导出到docx,html和pdf,(一次一个文件),但它们是处理单个文件的交互式工具,通常无法将旧文档文件“转换为”makrdown(iA) writer在这里有一些'limited'功能 .

为此,我们需要一个转换工具!

哪个转换工具?

我测试了这三个: Pandoc / Mammoth / w2m

macOS/Linux/Cygwin Windows 用户,请在这里阅读......

Windows Users - 请看下面的 'Writage'

潘多克

经过大量的测试, pandoc 是迄今为止最好的工具 .

语法: pandoc -s -f docx -t gfm --wrap=preserve somedoc.docx -o somedoc.md

我最初没有意识到的是,为了让 pandoc 导出Github Flavored Markdown(GFM)表(在pandoc中称为"pipe_tables"),你必须使用GFM pandoc格式 .

注意:MultiMarkdown是功能更丰富的格式,支持其他内容 - 元数据,目录,脚注,YAML - 但gfm也很棒 .

Pandoc支持的格式

-t gfm (GitHub-Flavored Markdown)

-t markdown_mmd (MultiMarkdown)

-t markdown (pandoc’s extended Markdown)

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/159265
推荐阅读
相关标签
  

闽ICP备14008679号