当前位置:   article > 正文

python 获取图片中的中文的几种办法_python 图片转文字

python 图片转文字

在Python中,获取图片中的中文文本通常需要使用光学字符识别(OCR)技术.

1.使用http请求库获取,分别主流有2种以下库

        使用百度OCR API:百度提供了OCR API服务,可以通过API调用来识别图片中的文本,包括中文。你需要注册百度开发者账号,获取API密钥,然后使用Python中的HTTP请求库发送图片并接收识别结果

        使用微软Azure OCR服务:微软Azure也提供了OCR服务,可以用来提取中文文本。与百度API类似,你需要注册Azure账号,创建一个OCR服务,然后使用Python中的HTTP请求库发送请求并获取结果。

2.使用第三方库,下面推荐4种第三方库及源码

Tesseract OCR库:

pip install pytesseract
 

  1. from PIL import Image
  2. import pytesseract
  3. # 打开图像
  4. image = Image.open('your_image.png')
  5. # 使用Tesseract进行文本提取
  6. text = pytesseract.image_to_string(image, lang='chi_sim')
  7. # 输出提取的中文文本
  8. print(text)

EasyOCR库:

pip install easyocr

  1. import easyocr
  2. # 创建EasyOCR Reader
  3. reader = easyocr.Reader(['ch_sim'])
  4. # 打开图像
  5. image = 'your_image.png'
  6. # 使用EasyOCR进行文本提取
  7. results = reader.readtext(image)
  8. # 输出提取的中文文本
  9. for (bbox, text, prob) in results:
  10. print(text)

PyOCR库:

    pip install pyocr
 

  1. import pyocr
  2. import pyocr.builders
  3. from PIL import Image
  4. # 获取Tesseract OCR工具
  5. tools = pyocr.get_available_tools()
  6. tool = tools[0]
  7. # 打开图像
  8. image = Image.open('your_image.png')
  9. # 使用PyOCR进行文本提取
  10. text = tool.image_to_string(
  11. image,
  12. lang='chi_sim',
  13. builder=pyocr.builders.TextBuilder()
  14. )
  15. # 输出提取的中文文本
  16. print(text)

Google Cloud Vision API库:

pip install google-cloud-vision

  1. from google.cloud import vision_v1p3beta1 as vision
  2. from google.oauth2 import service_account
  3. # 设置认证凭据
  4. credentials = service_account.Credentials.from_service_account_file(
  5. 'your-service-account-key.json'
  6. )
  7. # 创建Vision API客户端
  8. client = vision.ImageAnnotatorClient(credentials=credentials)
  9. # 打开图像
  10. with open('your_image.png', 'rb') as image_file:
  11. content = image_file.read()
  12. # 创建图像对象
  13. image = vision.Image(content=content)
  14. # 使用Vision API进行文本提取
  15. response = client.text_detection(image=image)
  16. # 输出提取的中文文本
  17. for text in response.text_annotations:
  18. print(text.description)

 请注意,对于Google Cloud Vision API,你需要替换 'your-service-account-key.json' 为你自己的服务账户密钥文件路径。确保在使用这些示例代码之前,你已经正确配置了相应的库和服务。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/799767
推荐阅读
相关标签
  

闽ICP备14008679号