赞
踩
要说生活里最常见、最便民的AI应用技术,OCR(Optical Character Recognition,光学字符识别)当属其中之一。寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。作为一名开发者,各种OCR相关的需求自然也少不了:卡证识别、票据识别、汽车场景、教育场景文字识别……
OCR领域向来开源repo比较少,大部分核心算法用在了商业化产品。今年算是OCR开源领域的丰收年,chineseocr_lite,easyocr,以及百度飞桨推出的PaddleOCR先后横空出世。
确实喜大普奔
对于OCR方向开发者而言,开源repo最吸引人的莫过于:
① 高质量的预训练模型
② 简单易上手的训练代码
③ 好用无坑的部署能力
简单对比一下目前主流OCR方向开源repo的核心能力
对于语种方面,easyOCR的优势在于多语言支持,非常适合有小语种需求的开发者;
从预训练模型来看,easyOCR目前暂无超轻量模型,chineseocr_lite最新的模型是10M左右,而PaddleOCR提供的8.6M是目前业界已知最轻量的;
对于部署方面,easyOCR模型较大不适合端侧部署,Chineseocr_lite和PaddleOCR都具备端侧部署能力;
对于自定义训练,实际业务场景中,预训练模型往往不能满足需求,对于自定义训练和模型Finetuning,目前只有PaddleOCR支持;
PaddleOCR项目地址:
https://github.com/PaddlePaddle/PaddleOCR
PaddleOCR 8.6M超轻量模型,支持自定义训练、丰富的部署方式(覆盖服务器端、移动端/嵌入式端(apk/sdk)多场景需求)。提供的超级开源开发者大礼包,无疑让开发者大呼过瘾 ,看一下repo中提供的教程文档,真心全覆盖。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。