有挑战才有收获！PaddleOCR算法模型挑战赛火热开启！_同花顺-文档图片表格结构识别算法

作者：小小林熬夜学编程 | 2024-02-25 03:58:39

踩

同花顺-文档图片表格结构识别算法

在数字化时代，文本和表格识别在生活和工作中扮演着越来越重要的角色。从扫描件、图片中的文字提取，到自动化录入数据、分析报表，这些场景都需要高效准确的文本识别和表格识别技术。作为PaddleOCR开源项目背后的维护者，飞桨团队一直致力于提升光学字符识别（Optical character recognition，OCR）技术的精度和效率，满足广大开发者和用户的需求。

PaddleOCR开源项目地址

https://github.com/PaddlePaddle/PaddleOCR

为了激发广大开发者的创新精神，进一步提升OCR模型的精度和性能，赋能更多的实际应用，开放原子开源基金会和百度飞桨共同举办了「PaddleOCR算法模型挑战赛」。

本次大赛是一项OCR领域的高难度技术挑战赛，要求参赛团队基于PaddleOCR开源项目，研发更高效准确的新模型，不断突破技术瓶颈。上期比赛情况回顾，请参看：https://pfcc.blog/posts/wuxi-kaifangyuanzi

赛题介绍

飞桨赛道共计发布两大赛题：OCR端到端识别任务与通用表格识别任务，参赛者需要任选一项任务，基于共建方提供的评估数据，给出相应的评估指标。同时，参赛者在提交解决方案时，需要保证推理速度与组织方提供的基线相当。

赛题一：OCR端到端识别任务

参赛者需要解决通用场景的OCR端到端识别问题，构建高效准确的OCR模型。要求新模型端到端指标F-measure超过62.24%。

赛题二：通用表格识别任务

参赛者需要解决表格结构复杂、数据分布不均等问题，提出具有创新性且高效推理的表格识别算法。要求在PubTabNet评估集上ACC超过76.31%。

时间安排

2024.1.15 - 比赛启动，参赛团队报名；
2024.1.15 - 开放提交，榜单每日更新；
2024.3.31 - 作品提交截止；
2024.4.8 - 初审结束，公布决赛答辩名单；
2024.4.15 - 进行线下评比（拟定）。

奖项设置

奖金池：￥300,000。

赛题一：OCR端到端识别任务

一等奖：1支队伍，奖金15万元
二等奖：1支队伍，奖金4万元
三等奖：1支队伍，奖金1万元
开源贡献奖：7支队伍，荣誉证书

赛题二：通用表格识别任务

一等奖：1支队伍，奖金7万元
二等奖：1支队伍，奖金2万元
三等奖：1支队伍，奖金1万元
开源贡献奖：7支队伍，荣誉证书

更多大赛细节，前往开放原子开源基金会官方大赛页面了解详情。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/138421