当前位置:   article > 正文

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结

     在使用tesserorc 时  博主也遇到了诸多问题   在经过 四处碰壁 与 资料查找后 最终安装成功,并成功的完成了图像识别 , 事后总结这这一条阳光大道 , 方法仅供参考  ,  希望 对 各位正处于到坑中的小伙伴们有所帮助  .   如果您有更好的方法 , 欢迎评论  或 留下 您的 传送门

 

1丶 先下载安装tesseract

            下载链接:http://digi.bib.uni-mannheim.de/tesseract

 

2 丶安装OCR:(安装成功后,配置好环境)

            勾选语言选项的时候,只要勾选需要的语言就好,不必要全选 不然安装的太慢了

       2.1 : 安装完毕后 进入cmd窗口进入安装程序路径下 执行命令:  tesseract -v    如果显示如下图,则表示成功

3 丶去下面网址找到 python版本 和 window系统版本 相对应的  whl 文件

https://github.com/simonflueckiger/tesserocr-windows_build/releases

 

4丶文件下载成功后 : 进入项目文件下的执行下面的命令 ( filename 为 下载的 whl文件名)

             pip install filename.whl

显示安装成功提示就表示安装成功了:

 

5 丶 环境搭好后 就能对图像进行识别了:

 简单实例:
  1. from PIL import Image
  2. import tesserocr
  3. # 创建一个Image 对象
  4. image = Image.open('yzm.jpg')
  5. # 调用方法image_to_text() ,完成Image对象的识别
  6. resul = tesserocr.image_to_text(image)
  7. print(resul)
  8. print(type(resul))
 
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号