当前位置:   article > 正文

使用pytesseract实现OCR入门级实战教程_pytesseract-ocr

pytesseract-ocr

本教程将学习使用Python对图像进行预处理,并使用pytesseract库进行文字识别。

0. 环境配置

0.1. 库

确保你已经安装了所需的库,可以通过以下方式安装:

pip install pillow

pip install pytesseract

pip install opencv-python

0.2. tesseract安装

① 安装Index of /tesseract  

或者从百度网盘进行下载百度网盘 请输入提取码

② 配置环境变量

D:\Tesseract-OCR为软件下载的地址

1. 导入库

  1. from PIL import Image
  2. import pytesseract
  3. import cv2
  4. import os

PIL用于图像处理,pytesseract用于OCR(光学字符识别),cv2用于图像的读取和显示。

2. 导入图像+预处理

  1. preprocess = 'blur' # thresh
  2. image = cv2.imread('test0.jpg') # 此处修改需要识别的图像
  3. gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  4. if preprocess == "thresh":
  5. gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
  6. elif preprocess == "blur":
  7. gray = cv2.medianBlur(gray, 3)

根据preprocess变量的值对灰度图像进行预处理。

如果是thresh则使用Otsu的方法进行阈值化处理;如果是blur则使用中值模糊。

3. 文字识别

  1. filename = "{}.png".format(os.getpid())
  2. cv2.imwrite(filename, gray)
  3. text = pytesseract.image_to_string(Image.open(filename), lang='chi_sim+eng')
  4. print(text)
  5. os.remove(filename)
  6. cv2.imshow("Image", image)
  7. cv2.imshow("Output", gray)
  8. cv2.waitKey(0)

使用pytesseract对保存的图像进行文字识别,并将结果打印出来。之后删除了临时文件。

chi_sim+eng同时使用中文(简体)和英文的语言模型进行文字识别。

4. 效果

导入的图

OCR结果

5. 声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】

推荐阅读
相关标签