赞
踩
安装环境:
python-3.7.4
pip 21.2.4
tesserocr是依赖tesseract进行工作的,所以要先下载tesseract。
1、下载
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
该地址提供了多个版本的下载文件,这里我们选择的是tesseract-ocr-setup-3.05.01.exe这个版本
2、安装
下载好以后双击进行安装即可,安装过程中会出现一个有多选框要选择的界面,这个界面有一项内容是:Additional language data(download),这个选项的意思是是否安装多国语言包,默认只安装了英文。所以看自己需求是否进行安装,我这里的建议是不安装,如果我们后期需要可以通过别的方式进行安装。
等待安装完成。
3、添加环境变量
为了方便使用,我们添加一下环境变量。
打开环境变量设置,在path中增加tesseract所在的文件夹即可
补充说明:
字体库下载地址https://github.com/tesseract-ocr/tessdata
中文字体库名称:chi_sim.traineddata
把下载好的文件放到tesseract下的tessdata目录下即可
1、下载tesserocr
tesserocr通过pip安装会报错,无法正确安装。所以我们通过下载whl的方式进行安装
下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
下载对应版本的文件,比如我的python是3.7.4 32位的,我就下载tesserocr-2.4.0-cp37-cp37m-win32.whl 32位的这个版本。下载好以后放到python安装目录的script目录下。
2、安装tesserocr
执行安装命令:
pip install tesserocr-2.4.0-cp37-cp37m-win32.whl
等待安装完成。
import tesserocr
from PIL import Image
image=Image.open("image.png")
result=tesserocr.image_to_text(image)
print(result)
准备好一张图片和这段代码,放在同一目录下执行会发现报错了。
.....省略若干字
RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Tool\Python\/tessdata/
这个时候要怎么解决呢?把第一步安装的tesseract目录下的tessdata这个文件夹拷贝到D:\Tool\Python/tessdata/报错的这个路径下,再执行就不会报错了。
yum install -y tesseract
这一步应该没有问题,等待安装完成即可。
pip install tesserocr pillow
这一步会报错:
省略若干字
error: command 'gcc' failed with exit status 1
省略若干字
解决方法:
先执行
yum install tesseract-devel -y
等待执行完成后再执行
pip install tesserocr pillow
即可安装完成
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。