当前位置:   article > 正文

pandoc实现LaTeX转word+公式格式批量转换_pandoc转word

pandoc转word

LaTeX转docx

1.1 引言

Pandoc 是一款免费且开源的文档格式转化工具,支持众多文本类型之间的转化,而且转化效果相当优秀。本文将介绍使用 Pandoc 将 .tex 转化成 .docx 文件的流程。(只在Windows环境下测试使用)

1.2 pandoc 安装

Pandoc 安装比较简单,可以在 Pandoc 官网 下载和安装最新版本, 或者在 Github Releases 下载需要的版本。(我是采用chocolatey安装,想了解的看这里chocolatey介绍与安装

1.3 基本使用

在 Windows 下打开 DOS 命令窗口(搜索窗口输入cmd)并进入到要转化的 .tex 目标文件的目录(进入E盘 输入:E:)。之后使用命令:

pandoc input.tex -o output.docx
  • 1

即可将 input.tex (input你自己的文件名)转化成 output.docx(output你想要的文件名)。 input 是输入的文件名,.tex 文件; output 是输出的文件名,注意必须是 .docx 后缀。转化的 .docx 文件不需要和 .tex 文件同名。

1.4 进阶使用

基本命令只能帮你把文章主体转化为word文档,如果你需要一个完整的学术文本,需要使用另一个工具 pandoc-crossref,Windows下,需要从 GitHub Repo下载 pandoc-crossref-Windows.7z,解压后将 pandoc-crossref.exe 粘贴到 Pandoc 的安装目录中。
注意: pandoc-crossref 的版本必须与 pandoc 的版本匹配。

1.4.1 启用 pandoc-crossref

命令后加入

--filter pandoc-crossref 
  • 1

1.4.1.1 公式编号

-M autoEqnLabels 
-M tableEqns
  • 1
  • 2

第一个自动给公式编号
第二个自动对齐(我安装的pandoc版本可能太低了,这个命令老是报错,在完整命令中我给删掉了)

1.4.1.2 标注的编号

Latex 中表格和图片的 \caption 的编号通过以下配置命令自动转化:

-t docx+native_numbering
  • 1

1.4.1.3 图片提取图片的提取: 需要同时指定文件搜索目录和图片的目录。

--extract-media=filename 
  • 1

其中filename 是tex源文件转换的目的文件的文件名。建议将要提取的图片都存于同一个文件夹下,图片只支持jpg,png等格式,对pdf不支持,需要先手动转换成jpg。

--resource-path=.;path 
  • 1

其中. 表示当前工作目录,; 是windows系统的分隔符号(Linux,Unix,macOs用:),path 是图片目录的名字,这句表示将在当前工作目录的path文件下来搜素图片和其他资源。

1.4.1.4 章节编号

通过添加以下配置命令生成各个章节的编号:

--number-sections
  • 1

1.4.2 参考文献

参考文献是论文写作中必不可少的部分,自动从 .tex 生成参考文献可节约大量格式转化的时间。 通过添加配置命令生成参考文献。

--bibliography=reference.bib
  • 1

注意:reference应改为你自己的文件名

1.4.2.1 指定参考文献格式

一些情况下需要生成指定格式的参考文献,例如需要 IEEE 或 Springer 的格式。 在 Pandoc 中,参考文献的格式是通过 .csl 文件指定。 在 Zotero Style Repository Zotero Style Repository可以下载到所需的 .csl 文件,如ieee.csl。将下载的 .csl 文件放置到与*.tex* 文件的同级目录下。使用命令指定格式:

--csl ieee.csl 
  • 1

此外,pandoc 生成指定格式的参考文献需要使用执行器,网络上很多教程推荐使用 --filter pandoc-citeproc这个命令。但新版本的 Pandoc 已经弃用了这个命令,而改为直接使用:

--citeproc
  • 1

由此完整的生成指定格式的参考文献命令为:

--citeproc --ieee.csl
  • 1

1.4.2.2 制定章节名称

上面命名只能生成参考文献列表,但不能生成参考文献的章节名。使用如下命令可以自定义参考文献的章节名:

-M reference-section-title=Reference
  • 1

其中 Reference 为自定义的章节名。

1.5 完整命令

学术论文中最常用的 .tex 文件转 .docx 命令为:

pandoc input.tex  --filter pandoc-crossref --extract-media=output --resource-path=.;path --citeproc --csl ieee.csl  --bibliography=reference.bib -M reference-section-title=Reference  -M autoEqnLabels  -t docx+native_numbering --number-sections -o output.docx
  • 1

1.6.1. 参考文献无法生成

在确保命令使用正确下从以下方面检查:

reference.bib 是否和要转换的 .tex 文件在同一目录下。
–filter pandoc-crossref 是否紧跟在 pandoc input.tex 后面。

1.6.2. docx 文件不更新

.tex 文件更新,但生成的*.docx* 文件并没有更新。

解决方法:

tex 文件更新后,需要正确编译后才能使用 Pandoc 成功转化为 .docx.

6.3. 部分LaTeX命令不能转换

1.\rm 换成 \mathrm
2.

\begin{flalign} ··· \end{flalign}
不能识别

公式批量转换

2.1 引言

LaTeX转的docx 里面的公式是WPS自带的公式编辑器Cambria Math格式,但是毕业论文要求的是Times New Roman格式,如果一个一个改非常麻烦,但是新版本的Mythtype给我们提供了批量改公式格式的办法,可以一键解决该问题。

参考

https://zhuanlan.zhihu.com/p/455713759
https://blog.csdn.net/qq_27464321/article/details/88853270

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/159242
推荐阅读
相关标签
  

闽ICP备14008679号