当前位置:   article > 正文

图片文字识别各种方法比较_图片文字识别模型对比

图片文字识别模型对比

网上有很多种图片文字识别方法,我这选了几种,做下比较

代码在这:

import tesserocr
from PIL import Image
import pytesseract

def a():
    #这是一种办法,使用tesserocr
    image=Image.open('xxx.jpg')
    result=tesserocr.image_to_text(image)
    print('使用tesserocr:',result)
    print('*'*50)

def b():
    # tesserocr更简便的方法
    print('使用tesserocr简便方法:',tesserocr.file_to_text('xxx.jpg'))
    print('*'*50)

def c():
    # 这是另一种办法,pytesseract
    image=Image.open('xxx.jpg')
    # result = pytesseract.image_to_string(image ,lang='chi_sim')
    result = pytesseract.image_to_string(image)
    print('使用pytesseract:',result)
    print('*' * 50)

a()
b()
c()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28

首先,汉字的识别,网上最多的是用pytesseract来识别

def c():
    # 这是另一种办法,pytesseract
    image=Image.open('xxx.jpg')
    result = pytesseract.image_to_string(image ,lang='chi_sim')
    print(result)
    print('*' * 50)
c()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

第一次,我们选择的是黑白比较分明的图片
在这里插入图片描述
识别效果:
在这里插入图片描述
总结:总体来说还行

第二次,使用黑白不那么分明的图片:
在这里插入图片描述
识别效果:
在这里插入图片描述
总结,似乎跟第一次差不太多

第三次,用黑白分明更弱些的图片:
在这里插入图片描述
识别效果:
在这里插入图片描述
总结:可以说是一塌糊涂了

然后,咱们试下识别英文,三种方法都可以,正好做下比较
第一次,使用颜色比较重的图片:
在这里插入图片描述
识别效果:
在这里插入图片描述
总结:可以看到,全对,由此可见,这些方法对英文的支持真不错

第二次,用颜色稍淡些的图片:
在这里插入图片描述
识别效果:
在这里插入图片描述
总结:tesserocr的简便写法出了点问题,其他两个还是全对

第三次,我们用一个带颜色的图片试试:
在这里插入图片描述
识别效果:
在这里插入图片描述
总结:显而易见,没问题

实验效果仅供参考,另外实验中发现数字的识别率和英文差不多,所以也就没写上来。其次,有干扰线或字母扭曲的识别率很差

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/296013
推荐阅读
相关标签
  

闽ICP备14008679号