参考资料:
福昕阅读器的文档:https://m.foxitsoftware.cn/company/product/964.html
微软支持(完全一模一样的问题)
先说一下,我的这个PDF复制文字乱码问题确实是被我解决了,但是我的这个PDF是有源文件的:一个PPT演示文档。所以我的做法可能不适用于那些只有一个“问题PDF”的朋友。
并且我的这个问题出现在mac上,已经有人反应过这个bug在新版mac上的出现。大概率是字体问题。
问题描述
我使用的是2021 M1芯片的macbook pro,我从学校的网站上下载了一个PPT,并且导出成PDF方便观看,但是当我直接复制PDF中的句子时,奇怪的事情发生了。如下图:
在复制文字的时候,出现了乱码,粘贴结果也会出现乱码。
一开始我觉得是和参考资料一一样的问题,背后的逻辑是这样的:PDF的制作者为了防止阅读者的电脑上没有相应的字体,于是把PDF中用到的字体嵌入到PDF文件中,那么这里复制出错就可以理解为我们的电脑里没有相应的字体文件,只要把这个字体文件安装进去就好了。
但是,我回到PPT文件上,这个PPT新建的时间非常早,于2006年。用的字体也是非常的常规,我的电脑上都有。并且我发现了,只有黑体字体在导出之后复制会出现乱码,其他的字体不会。那么就排除了上面的假设(字体都有的,不是缺字体)。很有可能是以前的黑体和现在的黑体发生了奇特的变化......
如何解决?
参考资料二认为这是一个bug,并且向office团队反应了。我的解决办法简单粗暴,即替换字体。注意这里是在PPT文件中替换字体。我也试过用福昕PDF编辑器直接编辑PDF文件,但是悲剧了,如下图:
看来这个完全就是字体编码的锅,导出的PDF在黑体字体上用了一种非常奇怪的编码方式。那么我们只好在PPT源文件里替换字体:格式->替换字体,把黑体换成宋体等其他字体。然后导出,生成的pdf复制就完全没有问题了。