赞
踩
项目代码地址:https://github.com/PaddlePaddle/PaddleOCR
创建虚拟环境(我装的python3.6)
更新pip: pip install --upgrade pip
安装paddle库: python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
(cpu版本)
pip install paddlepaddle
安装PPOCRLabel: pip install PPOCRLabel -i https://mirrors.aliyun.com/pypi/simple
启动: python PPOCRLabel.py --lang ch
以上展示了一张图像的识别结果
文件的识别结果导出有三个文件:
Cache.cach是工具自动标注的结果
fileState.txt保存了人工确认过后的图片信息
Label.txt保存了确认过的图片中识别出来的文字信息以及标注框的位置信息
之所以称为“半自动”工具,是因为它识别也不可能达到百分百准确,也需要人眼去校对是否准确,查到有错误的,直接点击那个识别框,然后就可以在右边的识别结果中进行修改,确认后才算打标完成。
注意:中间装包的时候可能会报无数个错,百度一下一步步解决就可以了
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。