赞
踩
最近做了几个OCR项目,现在基本已经结束,想利用这段闲暇时间,来对OCR进行系统的梳理一下,首先对ocr基础进行介绍。
1、OCR的定义
OCR,中文又叫光学字符识别,它是利用光学技术和计算机技术将目标上的文字信息提取出来。OCR识别是计算器视觉研究领域之一,目前生活中的应用也比较成熟,比方说,身份证识别,车牌号识别,拍题搜答案等应用。
2、OCR的分类
目前主要根据识别字体分成两类:印刷体识别和手写体识别。
印刷体识别相对简单些,字体比较规则,有几十种字体规则。但是也有一些因为字符印刷墨迹的断裂,粘连,遮挡等造成识别困难,总的来说,印刷体的识别目前识别情况已经相当不错了,但是还没能达到100%识别准确。
手写字体一直是OCR界想攻克的难关,主要因为手写字体比较多样化且具有个人特色,就比方说医生开的药方,人眼都很难辨认写的是什么,机器也很难理解。
3、ocr识别方法
目前主要有以下几种:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。