当前位置:   article > 正文

实战 | 使用图像处理改善OCR结果(详细步骤 + 源码)_ocr源码

ocr源码

导  读

    本文主要介绍一个通过图像处理改善OCR识别结果的实例,并给出详细步骤和源码。

背景介绍

    在很多情况下,文字识别会遇到困难。比如非单一的背景、杂讯干扰、文字部分缺失等。如下图所示:

    我们希望识别图中的黑色文字(12-14),但背景较复杂且存在其他干扰,如果直接用Tesseract识别(代码如下),识别结果为空。

# -*- coding:utf-8 -*- import pytesseractfrom PIL import Image # 打开图像image = Image.open('0.png') # OCR识别:lang默认英文text = pytesseract.image_to_string(image) # 打印识别后的文本print(text)

    对这种复杂情况的文字识别,直接去识别很容易失败。思考:可不可以通过图像处理将我们需要的部分分割或凸显出来再做识别?本文将以此为例做演示说明。

      

详细实现步骤

    【1】OTSU二值化​​​​​​​

image = cv2.imread('0.png')
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小舞很执着/article/detail/1006295
推荐阅读
  

闽ICP备14008679号