当前位置:   article > 正文

Windows使用PPOCRLabel_win ppocrlabel

win ppocrlabel

问题

想使用PaddleOcr下面的标注工具PPOCRLabel进行图像文本检测标注,在windos下安装出现了一些问题,耗费了半天时间解决了这个问题

项目地址:https://github.com/PaddlePaddle/PaddleOCR

安装包requirements

shapely
scikit-image
imgaug==0.4.0
pyclipper
lmdb
tqdm
numpy
visualdl
python-Levenshtein
opencv-contrib-python==4.4.0.46
cython
lxml
premailer
openpyxl
fasttext==0.9.1
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

windows安装

安装PPOCRLabel
教程: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md

先安装PaddleOcr所需的包

pip install -r requrements.txt -i https://mirror.baidu.com/pypi/simple
  • 1

在安装到python-Levenshtein时候报错:

building ‘Levenshtein._levenshtein’ extension error: Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools”: https://visualstudio.microsoft.com/visual-cpp-build-tools/

查看问题,解决方法:

下载安装vs相关的东西之后再安装就不报错了,继续安装paddleLabel

按照教程安装环境

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install PPOCRLabel 
  • 1
  • 2

结果

在这里插入图片描述
会下载通用的模型进行自动标注,后续只需要人为的微调一些即可

在这里插入图片描述

文件名说明
Label.txt检测标签,可直接用于PPOCR检测模型训练。用户每确认5张检测结果后,程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。
fileState.txt图片状态标记文件,保存当前文件夹下已经被用户手动确认过的图片名称。
Cache.cach缓存文件,保存模型自动识别的结果。
rec_gt.txt识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏“文件” - "导出识别结果"后产生。
crop_img识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。
快捷键说明
Ctrl + shift + R对当前图片的所有标记重新识别
W新建矩形框
Q新建四点框
Ctrl + E编辑所选框标签
Ctrl + R重新识别所选标记
Ctrl + C复制并粘贴选中的标记框
Ctrl + 鼠标左键多选标记框
Backspace删除所选框
Ctrl + V确认本张图片标记
Ctrl + Shift + d删除本张图片
D下一张图片
A上一张图片
Ctrl++缩小
Ctrl–放大
↑→↓←移动标记框
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/132591
推荐阅读
相关标签
  

闽ICP备14008679号