当前位置:   article > 正文

PaddleOCR明星模型驱动4条星河零代码产线上线,全面覆盖通用与复杂文档场景信息化难题...

PaddleOCR明星模型驱动4条星河零代码产线上线,全面覆盖通用与复杂文档场景信息化难题...

c22f7b774f552b805526bd9c997dedef.gif

上个月,飞桨星河社区迎来了一次重大升级,隆重推出了星河零代码产线。开发者无需具备任何代码开发经验,仅需准备好符合产线要求的数据集,便能轻松开启从数据准备到模型部署的全流程AI体验。令人振奋的是,飞桨星河社区近期在PaddleOCR明星模型的强大支持下,新增了通用场景信息抽取、通用OCR和通用表格识别三条OCR相关产线。至此,结合原有的文档场景信息抽取产线,飞桨星河社区已成功汇聚四条OCR相关零代码产线,为开发者带来更高效、便捷的开发新体验。

体验链接:

https://aistudio.baidu.com/pipeline/mine

a58304fbf85387209fb49c9722f77814.png

dafa347a8d58a7d1395b92e7ac258d62.png

升级亮点

  • 汇聚 OCR 常见场景任务,通用与复杂文档场景全面覆盖

  • 便捷的badcase分析,快速定位问题

  • 全新的场景任务开发范式,一条产线涵盖多个模型的全流程开发

  • 支持高性能服务化部署,卓越性能与易用性兼得

76bb2547a0b76e0c579e049f5c4dfa2d.png

汇聚 OCR 常见场景任务,通用与复杂文档场景全面覆盖

本次升级全面覆盖了通用OCR、通用表格识别、通用图像信息抽取以及文档场景信息抽取四大OCR核心任务。在语言大模型的实际运用中,通用OCR和通用表格识别发挥着不可或缺的关键作用。通用场景信息抽取和文档场景信息抽取是文本图像信息抽取任务的两种类别,通用场景信息抽取凭借先进的OCR技术,能够迅速识别提取各类图像中的文字信息,进一步通过文心一言提取关键信息,其应用范围广泛,包括但不限于照片、广告牌、路标等通用场景中的信息抽取。而文档场景信息抽取则更为精细和复杂。该技术不仅融合了通用OCR技术,还结合了文本图像版面分析技术,使得其不仅能够准确识别文档中的文字,还能深入解析文档的版面结构,进一步通过文心一言提取关键信息。

a589b57f82d6a368bd0f830527c688f8.png

通用OCR任务示例

94e3012552ca3fab7d5efdc3f2202077.png

通用表格识别任务示例

83342281c183bca0e03e497171f1ecf1.png

便捷的badcase分析,快速定位问题

针对各场景任务,本次着重优化了模型产线的在线体验。这些在线体验都是基于PaddleOCR的明星模型。一方面,可以快速验证这些通用模型是否满足场景需求。另一方面,提供了关键的中间结果,方便开发者发现目前通用能力的不足,从而为后续的优化工作提供指导方向。下面是通用场景信息抽取在线体验界面,一方面给出了小模型中间结果,便于分析模型能力,定位有问题的模型,另一方面当解析完一张图像,可以多次与大模型交互,确认抽取关键信息的效果。同时,在线体验还支持开发者实时更新通过模型产线训练的模型,并即时查看其表现。

391d65921e1f7bc6eda68ee15c5e63bb.png

4edfe577dfc66e6f80a62a81b0567450.png

全新的场景任务开发范式,一条产线涵盖多个模型的全流程开发

OCR场景任务常涉及多个模型的协同工作,这些模型通常各自独立训练。在传统开发流程中,单模型的训练与多模型的组合预测往往依赖于繁琐的文档进行衔接。然而,本次升级引入了一种全新的场景任务开发范式,它以场景任务为核心,实现了模型的统一汇聚。在这一新的框架下,一条产线即可涵盖多个模型的全流程开发,大大简化了开发者的操作流程,使得模型训练和部署变得更为便捷高效。

0e2675199f9543d617f4d70a624d2f19.png

d28dd26499acf177c723e49f7cad8ee4.png

支持高性能服务化部署,卓越性能与易用性兼得

本次升级提供了基于飞桨FastDeploy高性能服务化部署能力,支持开发者平台部署和本地部署。飞桨FastDeploy的高性能服务化部署方案以Triton Inference Server为基础,整合了飞桨高性能推理模块,并融入FastDeploy的前后处理模块,实现了端到端的无缝集成。该方案以快速部署、简单易用、性能卓越为核心优势,为用户提供了便捷的部署体验。开发者可轻松在AI Studio平台上进行在线部署,无需复杂编程知识,即可迅速构建稳定高效的服务环境。此外,用户还可选择导出服务化部署包,根据本地硬件资源条件进行灵活部署,以满足不同场景下的服务需求。

7e286b9f1e4319ade30e544db8c6fa41.png

f23fed791f0d99b9b467046e72718bd0.png

精彩课程预告

为了帮助您迅速且深入地了解四大OCR任务模型产线,并熟练掌握实际操作技巧,百度高级研发工程师将在5月16日(周四)19:00,为您详细解读四大OCR场景任务以及全新开发范式。此外,我们还将开设针对OCR任务的零代码开发产业场景实战营,引导您一步一步体验从数据准备、数据校验、模型训练、性能优化到模型部署的完整开发流程,报名参与实战营的开发者可享受7日零代码产线训练评估算力全免费!机会难得,立即扫描下方二维码或点击文末“阅读原文”预约吧!

beb195d87083972244619a759a0f1c72.png

44d981ddc5ee0c713a7432dced1efafa.png使用传送门

  • 文档场景信息抽取产线使用文档:

    https://ai.baidu.com/ai-doc/AISTUDIO/Blu5jv0zm

  • 通用场景信息抽取产线使用文档:

    https://ai.baidu.com/ai-doc/AISTUDIO/plvkdkk2v

  • 通用OCR使用文档:

    https://ai.baidu.com/ai-doc/AISTUDIO/Elvkdprq9

  • 通用表格识别使用文档:

    https://ai.baidu.com/ai-doc/AISTUDIO/1lvkdr2yd

81eabafd42d0c2d95713fd4532a3a3cd.png

8c708145eb749e5c872787bed51003eb.png

8f9ffb1d1a1925af46881dd88a58bdcc.png

91456de889836052e50466d47eb39e98.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/576480
推荐阅读
相关标签
  

闽ICP备14008679号