赞
踩
Pandoc 是一款免费且开源的文档格式转化工具,支持众多文本类型之间的转化,而且转化效果相当优秀。本文将介绍使用 Pandoc 将 .tex 转化成 .docx 文件的流程。(只在Windows环境下测试使用)
Pandoc 安装比较简单,可以在 Pandoc 官网 下载和安装最新版本, 或者在 Github Releases 下载需要的版本。(我是采用chocolatey安装,想了解的看这里chocolatey介绍与安装)
在 Windows 下打开 DOS 命令窗口(搜索窗口输入cmd)并进入到要转化的 .tex 目标文件的目录(进入E盘 输入:E:)。之后使用命令:
pandoc input.tex -o output.docx
即可将 input.tex (input你自己的文件名)转化成 output.docx(output你想要的文件名)。 input 是输入的文件名,.tex 文件; output 是输出的文件名,注意必须是 .docx 后缀。转化的 .docx 文件不需要和 .tex 文件同名。
基本命令只能帮你把文章主体转化为word文档,如果你需要一个完整的学术文本,需要使用另一个工具 pandoc-crossref,Windows下,需要从 GitHub Repo下载 pandoc-crossref-Windows.7z,解压后将 pandoc-crossref.exe 粘贴到 Pandoc 的安装目录中。
注意: pandoc-crossref 的版本必须与 pandoc 的版本匹配。
命令后加入
--filter pandoc-crossref
-M autoEqnLabels
-M tableEqns
第一个自动给公式编号
第二个自动对齐(我安装的pandoc版本可能太低了,这个命令老是报错,在完整命令中我给删掉了)
Latex 中表格和图片的 \caption 的编号通过以下配置命令自动转化:
-t docx+native_numbering
--extract-media=filename
其中filename 是tex源文件转换的目的文件的文件名。建议将要提取的图片都存于同一个文件夹下,图片只支持jpg,png等格式,对pdf不支持,需要先手动转换成jpg。
--resource-path=.;path
其中. 表示当前工作目录,; 是windows系统的分隔符号(Linux,Unix,macOs用:),path 是图片目录的名字,这句表示将在当前工作目录的path文件下来搜素图片和其他资源。
通过添加以下配置命令生成各个章节的编号:
--number-sections
参考文献是论文写作中必不可少的部分,自动从 .tex 生成参考文献可节约大量格式转化的时间。 通过添加配置命令生成参考文献。
--bibliography=reference.bib
注意:reference应改为你自己的文件名
一些情况下需要生成指定格式的参考文献,例如需要 IEEE 或 Springer 的格式。 在 Pandoc 中,参考文献的格式是通过 .csl 文件指定。 在 Zotero Style Repository Zotero Style Repository可以下载到所需的 .csl 文件,如ieee.csl。将下载的 .csl 文件放置到与*.tex* 文件的同级目录下。使用命令指定格式:
--csl ieee.csl
此外,pandoc 生成指定格式的参考文献需要使用执行器,网络上很多教程推荐使用 --filter pandoc-citeproc这个命令。但新版本的 Pandoc 已经弃用了这个命令,而改为直接使用:
--citeproc
由此完整的生成指定格式的参考文献命令为:
--citeproc --ieee.csl
上面命名只能生成参考文献列表,但不能生成参考文献的章节名。使用如下命令可以自定义参考文献的章节名:
-M reference-section-title=Reference
其中 Reference 为自定义的章节名。
学术论文中最常用的 .tex 文件转 .docx 命令为:
pandoc input.tex --filter pandoc-crossref --extract-media=output --resource-path=.;path --citeproc --csl ieee.csl --bibliography=reference.bib -M reference-section-title=Reference -M autoEqnLabels -t docx+native_numbering --number-sections -o output.docx
在确保命令使用正确下从以下方面检查:
reference.bib 是否和要转换的 .tex 文件在同一目录下。
–filter pandoc-crossref 是否紧跟在 pandoc input.tex 后面。
.tex 文件更新,但生成的*.docx* 文件并没有更新。
解决方法:
tex 文件更新后,需要正确编译后才能使用 Pandoc 成功转化为 .docx.
1.\rm 换成 \mathrm
2.
LaTeX转的docx 里面的公式是WPS自带的公式编辑器Cambria Math格式,但是毕业论文要求的是Times New Roman格式,如果一个一个改非常麻烦,但是新版本的Mythtype给我们提供了批量改公式格式的办法,可以一键解决该问题。
https://zhuanlan.zhihu.com/p/455713759
https://blog.csdn.net/qq_27464321/article/details/88853270
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。