当前位置:   article > 正文

多环境下安装tesserocr_tesserocr cp37

tesserocr cp37

window10安装

安装环境:
python-3.7.4
pip 21.2.4

1.下载安装tesseract

tesserocr是依赖tesseract进行工作的,所以要先下载tesseract。
1、下载
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
该地址提供了多个版本的下载文件,这里我们选择的是tesseract-ocr-setup-3.05.01.exe这个版本

2、安装
下载好以后双击进行安装即可,安装过程中会出现一个有多选框要选择的界面,这个界面有一项内容是:Additional language data(download),这个选项的意思是是否安装多国语言包,默认只安装了英文。所以看自己需求是否进行安装,我这里的建议是不安装,如果我们后期需要可以通过别的方式进行安装。
等待安装完成。

3、添加环境变量
为了方便使用,我们添加一下环境变量。
打开环境变量设置,在path中增加tesseract所在的文件夹即可

补充说明:
字体库下载地址https://github.com/tesseract-ocr/tessdata
中文字体库名称:chi_sim.traineddata
把下载好的文件放到tesseract下的tessdata目录下即可

2.下载安装tesserocr

1、下载tesserocr
tesserocr通过pip安装会报错,无法正确安装。所以我们通过下载whl的方式进行安装
下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
下载对应版本的文件,比如我的python是3.7.4 32位的,我就下载tesserocr-2.4.0-cp37-cp37m-win32.whl 32位的这个版本。下载好以后放到python安装目录的script目录下。

2、安装tesserocr
执行安装命令:
pip install tesserocr-2.4.0-cp37-cp37m-win32.whl
等待安装完成。

3、使用tesserocr
import tesserocr
from PIL import Image

image=Image.open("image.png")
result=tesserocr.image_to_text(image)
print(result)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

准备好一张图片和这段代码,放在同一目录下执行会发现报错了。

.....省略若干字
RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Tool\Python\/tessdata/
  • 1
  • 2

这个时候要怎么解决呢?把第一步安装的tesseract目录下的tessdata这个文件夹拷贝到D:\Tool\Python/tessdata/报错的这个路径下,再执行就不会报错了。

Centos安装

1、安装tesseract
yum install -y tesseract
  • 1

这一步应该没有问题,等待安装完成即可。

2、安装tesserocr
pip install tesserocr pillow
  • 1

这一步会报错:

省略若干字
error: command 'gcc' failed with exit status 1
省略若干字
  • 1
  • 2
  • 3

解决方法:

先执行
yum install tesseract-devel -y
等待执行完成后再执行
pip install tesserocr pillow
  • 1
  • 2
  • 3
  • 4

即可安装完成

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/119829
推荐阅读
相关标签
  

闽ICP备14008679号