GitHub Trending第一之后，PaddleOCR再发大招：百度自研顶会SOTA算法正式开源！_paddleocr是中国自研的吗

作者：Monodyee | 2024-05-19 15:54:34

踩

paddleocr是中国自研的吗

要说生活里最常见、最便民的AI应用技术，OCR（Optical Character Recognition，光学字符识别）当属其中之一。寻常到日常办理各种业务时的身份证识别，前沿到自动驾驶车辆的路牌识别，都少不了它的加持。作为一名开发者，各种OCR相关的需求自然也少不了：卡证识别、票据识别、汽车场景、教育场景文字识别……

OCR领域向来开源repo比较少，大部分核心算法用在了商业化产品。今年算是OCR开源领域的丰收年，chineseocr_lite，easyocr，以及百度飞桨推出的PaddleOCR先后横空出世。

确实喜大普奔

对于OCR方向开发者而言，开源repo最吸引人的莫过于：

① 高质量的预训练模型

② 简单易上手的训练代码

③ 好用无坑的部署能力

简单对比一下目前主流OCR方向开源repo的核心能力

对于语种方面，easyOCR的优势在于多语言支持，非常适合有小语种需求的开发者；

从预训练模型来看，easyOCR目前暂无超轻量模型，chineseocr_lite最新的模型是10M左右，而PaddleOCR提供的8.6M是目前业界已知最轻量的；

对于部署方面，easyOCR模型较大不适合端侧部署，Chineseocr_lite和PaddleOCR都具备端侧部署能力；

对于自定义训练，实际业务场景中，预训练模型往往不能满足需求，对于自定义训练和模型Finetuning，目前只有PaddleOCR支持；

PaddleOCR项目地址：

https://github.com/PaddlePaddle/PaddleOCR

PaddleOCR 8.6M超轻量模型，支持自定义训练、丰富的部署方式（覆盖服务器端、移动端/嵌入式端（apk/sdk）多场景需求）。提供的超级开源开发者大礼包，无疑让开发者大呼过瘾，看一下repo中提供的教程文档，真心全覆盖。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/593619?site