当前位置:   article > 正文

进入AI领域做产品 —— 我的自学之路(CV-OCR)_cv和ocr

cv和ocr

计算机视觉 —— 光学符号检测

        光学符号检测、多目标跟踪也是计算机视觉中的热门方向,基于jasmine分享的内容,此处在人脸识别之后我也继续进行归纳,多获得一个方向的认知也是很不错的。

概念

        将图像上的字符进行分析识别,将其准化为文本格式的字符序列。

实现

图像采集:

  • 摄像头选取需要考虑到两个指标:
    • 像素分辨率:
      • 可以通过所检测物体的最小特征决定像素分辨率;
      • 像素分辨率=(检测物体最大长度/物体最小特征值)*2;
      • 假设字符最大长度为300mm,最小特征值为1mm,则最小所需分辨率为600。
    • 摄像头焦距(F):
      • CCD传感器的尺寸(Ss);
      • 工作距离(摄像机镜头到被测物体的距离Wd);
      • 摄像机的视场范围(Os);
      • F由以上3个参数决定,若系统要求严格,还需采用预防抖动的数码相机采集图像。
  • 图像常见格式有BMP、GIF、JPG等,其中BMP格式最不容易出问题。

图像预处理:

  • 二值化;
  • 图像增强;
  • 噪声处理;
  • 滤波。

特征提取:

  • 灰度聚类:
    • 聚类:
      • 聚类是根据图像特点自适应地进行多值化的过程。
    • 分割:
      • “极大值极小值分割”聚类方式:有多少个极大值点,就聚为多少类,并且以极小值作为类别之间的边界。通过聚类可将图片分成不同图层。
  • 分层识别:
    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/891999
    推荐阅读
    相关标签
      

    闽ICP备14008679号