channels:
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
show_channel_urls: true
ssl_verify: true

3.3、安装tesseract程序

下载tesseract的exe安装文件，安装包地址：https://github.com/UB-Mannheim/tesseract/wiki

我下的是 tesseract-ocr-w64-setup-v5.0.1.20220118.exe版本。（本机是64位操作系统）

选配项中记得选择中文的语言，后期识别中文字体做准备。

配置tesseract系统环境变量，将 tesseract-ocr的绝对路径配置在系统变量中。

【从C:\Program Files\Tesseract-OCR安装目录下，直接把tessdata 文件夹里的内容都复制到C:\Users\Administrator\Anaconda3，另外tessdata 文件夹里chi_sim.traineddata，eng.traineddata文件需要复制到C:\ProgramData\Anaconda3下，不然后面运行程序会提示找不到文件，配置好环境变量也不行！】（据说是霸王条款）

重启系统让变量生效。

3.4、安装pytesseract模块

运行Anaconda 终端命令，执行conda install tesserocr pillow

系统已经显示我已经安装。（安装的时间有一些长，需要耐性等待。）

执行另外一个指令conda install pytesseract (安装pytesseract,这个安装需要一点时间等待了）

使用python语句进行验证。

3.5、见证奇迹的环节

测试1：

在pycharm编译器中执行语句操作：


from PIL import Image
import pytesseract
 
image = Image.open("粉丝.jpg") #打开图片
#print(image.size) #测试图片像素尺寸
text = pytesseract.image_to_string(image, lang='chi_sim') #图片转字符串
text = text.replace("“ ","").replace("。","") #去掉杂质，提纯
print(text) #测试结果

原图片粉丝.jpg：

编译结果：.(已经成功识别图片内部的文字，进行呈现。)

测试2：

原图2

测试结果：可以正常识别图片文字出来了。

参考网友知识：

python提取图片中的文字_帅帅de三叔的博客-CSDN博客_python提取图片文字

anaconda+python+tesseract安装，亲试可用_icanfly728的博客-CSDN博客_anaconda安装库 pytesseract

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/2023面试高手/article/detail/485971