深延科技：基于深度学习的智能OCR识别技术大有可为_深度内容识别技术

作者：寸_铁 | 2024-08-20 08:56:41

踩

深度内容识别技术

智能OCR技术作为人工智能领域的重要原子能力之一，在行业转型过程中发挥作用。近年来，移动互联、大数据等新技术飞速发展，倒逼传统行业向智能化、移动化的方向转型。这一大趋势也促使传统OCR技术不断向智能OCR升级，以满足更复杂、更高要求的任务需求。

随着深度学习的融入，实现了OCR对复杂文本的识别，即智能OCR识别。同时配合其他信息化手段的综合应用，使智能OCR具备移动端适配、多任务检测、整行识别、图像分割定位和分类等功能，应用场景更加广泛，在图书情报领域中的图书文本和卡证识别会更高效。

01 传统OCR识别技术缺陷渐露

光学字符识别（Optical Character Recognition，OCR）指自动识别图像中的文字内容，属于人工智能机器视觉领域的一个重要的分支，即把文本、卡证等载体上的文字通过光学等技术手段转化为计算机认识的电子化数据。传统OCR识别采用统计模式，处理流程较长，包括图像的预处理、二值化、连通域分析、版面分析、行切分、字切分、单字符识别和后处理等步骤。典型的传统OCR识别流程如图1所示。

图1 传统OCR识别技术流程

传统OCR识别方法存在诸多弊端，汇总如下：a）在进行版面分析时，使用大量的规则，导致程序维护成本很高。b）行业域分析完全依靠图像二值化得到的二值图，对于扫描文档效果尚可，面对手机拍摄和高拍仪取图

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/寸_铁/article/detail/1006284