当前位置:   article > 正文

PDFSDK(支持多种平台)_pdf sdk

pdf sdk

简介

PDF文档的解析,自动化编辑一直是一个难题。毕竟PDF主要用于交流,但大数据时代,PDF文档蕴含了海量的信息,从PDF文档中抽取信息,并应用到各种场景是一个很实际的问题。不同于之前博客提到的PDFCoverter,本项目更适合大规模PDF文档的处理。项目开源地址:PDFSDK

支持的操作系统与编程语言

该项目依赖于Foxit Quick PDF Library,支持Linux,Windows,MacOS等系统。提供Python,C#,C++,C,Java,PHP,Objective-C, Swift, JavaScript等API,非常方便部署。网上有各种激活码,商用购买大概每台机子300-999$。

相比PDFConverter

  1. PDFConverter使用的是Acrobat Pro DC提供的SDK,由于PDF标准是Adobe公司制定的,他们的SDK对PDF解析非常好。但买他们的SDK比较贵,自己用可以在Windows装Adobe Acrobat DC(平时拿来看paper),转换速度大概是 page/sec。对其他系统支持比较麻烦,需购买他们提供的Adobe PDF Library,需要购买激活码。
  2. FOxit Quick PDF Library文本抽取比较快,但提取的效果没有前者好,损失了很多layout信息。二者各有千秋,根据自己需要选择。
  3. 除了文本抽取,这两家公司提供的SDK都支持PDF文档的编辑,合并等。
  4. Adobe 提供多种SDK,比如:
    • Adobe Acrobat Export PDF (25$/year),只包含导出功能
    • Adobe Acrobat PDF Pack (120$/year),导出,合并,发送
    • Acrobat Pro DC (168$/year),完整PDF解决方案,PDFConverter使用的就是这个,网上也有很多破解版,自行查找。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/242986
推荐阅读
相关标签
  

闽ICP备14008679号