赞
踩
首先介绍一个名词OCR(Optical Character Recognition,光学字符识别)。是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
文字识别OCR通常应用在证件识别(身份证,驾驶证,护照,名片)、文档检索、截图识别(猿题库,作业帮)
实际上我们预期的结果是把只有包含单个文字的图片交给计算机去翻译。
机器是怎么看到纸质或者电子文档或是图片上的文字的呢?接下来看一下他的工作流程:
首先要去掉杂质,这样程序就可以集中注意到文字上面。
预处理主要包括灰度化,二值化,噪声去除,倾斜矫正等。
灰度化:
灰度图是只含亮度信息,不含色彩信息的图片。
在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值。
一般满足下面这个公式:
Gray=0.299R+
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。