赞
踩
OCR是Optical Character Recognition的缩写,光学字符识别的意思。
EasyOCR是一个python模块,用于从图像中提取文本。它是一个通用的OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持80多种语言,并且还在扩展。
左边是支持的语言,右边是支持的语言对应的代码
如果使用pytorch,可以再pytorch网站安装与查看说明使用。确保选择正确的CUDA版本。如果您打算只在CPU模式下运行,请选择CUDA = None。
pip install easyocr
pip install git+git://github.com/jaidedai/easyocr.git
# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg')
#打印识别结果
print(result)
输出的是列表格式,每一项分别代表文本框坐标[x,y]、文本和模型置信度的列表。
# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0)
#打印识别结果
print(result)
输出的是列表格式,每一项是识别到的文本。
# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0, paragraph=True)
#打印识别结果
print(result)
输出的是列表格式,内容直接是识别到的文本,不分项。
前三块代码识别图片输入的是本地图片路径
result = reader.readtext('chinese_tra.jpg')
字节格式的图像信息识别可以改写成如下代码:
with open("chinese_tra.jpg", "rb") as f:
img = f.read()
result = reader.readtext(img)
URL网页图片信息识别可以改成如下代码
result = reader.readtext('图片的URL网址信息')
如果运行程序的时候,程序自动下载模型出错,或者中断
可以点击这里进行手动下载模型,下载好的模型复制粘贴到路径:C:\Users\**********\.EasyOCR\model\
下即可正常使用。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。