当前位置:   article > 正文

【Python 基于EasyOCR库进行图片文字识别】_python easyocr识别艺术字处理

python easyocr识别艺术字处理

一、概况

OCR是Optical Character Recognition的缩写,光学字符识别的意思。
EasyOCR是一个python模块,用于从图像中提取文本。它是一个通用的OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持80多种语言,并且还在扩展。

目前支持的语言

左边是支持的语言,右边是支持的语言对应的代码1
2
3
4
5

二、安装指南(windows)

如果使用pytorch,可以再pytorch网站安装与查看说明使用。确保选择正确的CUDA版本。如果您打算只在CPU模式下运行,请选择CUDA = None。

1、通过pip安装

pip install easyocr
  • 1

2、通过源代码安装

pip install git+git://github.com/jaidedai/easyocr.git
  • 1

三、代码运用OCR

要识别的图片

6

1、代码_I

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg')
#打印识别结果
print(result)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

识别结果_1

输出的是列表格式,每一项分别代表文本框坐标[x,y]、文本和模型置信度的列表。
7

2、代码_II

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0)
#打印识别结果
print(result)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

识别结果_2

输出的是列表格式,每一项是识别到的文本。
8

3、代码_III

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0, paragraph=True)
#打印识别结果
print(result)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

识别结果_3

输出的是列表格式,内容直接是识别到的文本,不分项。
9

4、代码_IV

前三块代码识别图片输入的是本地图片路径

result = reader.readtext('chinese_tra.jpg')
  • 1

字节格式的图像信息识别可以改写成如下代码:

with open("chinese_tra.jpg", "rb") as f:
    img = f.read()
result = reader.readtext(img)
  • 1
  • 2
  • 3

URL网页图片信息识别可以改成如下代码

result = reader.readtext('图片的URL网址信息')
  • 1

运行报错处理

如果运行程序的时候,程序自动下载模型出错,或者中断
10
可以点击这里进行手动下载模型,下载好的模型复制粘贴到路径:C:\Users\**********\.EasyOCR\model\ 下即可正常使用。

点击了解更多

小凹兔

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/799736
推荐阅读
相关标签
  

闽ICP备14008679号