赞
踩
python的ocr文字识别库很多,最开始试了pytesseract库,识别准确性不行,它使用的中文识别训练模型好像都是3-5年前的。然后找到了paddleocr库,识别度较高。下面是它的安装步骤与遇到的问题记录:
想使用python的paddleocr进行图片识别文字ocr,需要安装paddle,paddleocr,paddlepaddle-gpu这些模块。
(paddlepaddle-gpu是用gpu进行ocr处理,速度很快,如果使用cpu,也是到第三步的网站中选择cpu版本(模块名称叫paddlepaddle),获取相应的安装代码)
安装过程:
1.paddle的安装
pip install paddle
安装paddle遇到的问题,提示缺少common、dual、tight、data、prox等模块,那么一一安装即可。然后在终端中输入pip install paddle(注意要安装到目标代码运行的环境中),或者用pycharm自带的模块安装(到文件-设置-项目:xxx-python解释器中,点加号,搜索paddle然后点安装即可)。
pip install paddleocr
这是百度开发的中文名为“飞桨”的库,可到官网
开始使用_飞桨-源于产业实践的开源深度学习平台
找到自己电脑对应的安装命令
复制安装命令,到pycharm的terminal中,或者cmd中cd到你运行代码的环境中,粘贴,即可开始安装。
这个库的运行需要调用很多东西,它的正常运行需要电脑的cuda和cudnn都首先安装成功,这两者的安装可以去搜索其他教程,网上很多。
第一类问题:cudnn配置不对
模块都安装完了,但运行总是报错。(可能是cudnn的安装有瑕疵,我只复制了一部分文件到CUDA文件夹下)
运行报错提示,缺少cudnn.xxxx.dll。
解决办法:到下载的cudnn压缩包解压的文件夹里,找到提示的缺少的文件,复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7目录下对应的文件夹中,即可一一解决path not found的问题。
第二类问题:paddle相关库的安装位置不对
我的电脑安装了python3.10和python3.11两个版本。似乎paddlepaddle-gpu是安装在python3.11.xx上,其他的库安装到了python3.10的环境里。而我一直使用的都是python3.10.11,最后卸载了python3.11.xx,果然,paddlepaddle-gpu也被删除了,重新安装,然后运行成功。
使用gpu速度极快。速度提升几十倍。
ocr = PaddleOCR(use_gpu=True)的运行记录:
[2023/09/18 13:30:30] ppocr WARNING: Since the angle classifier is not initialized, it will not be used during the forward process
[2023/09/18 13:30:30] ppocr DEBUG: dt_boxes num : 20, elapsed : 0.04336738586425781
[2023/09/18 13:30:30] ppocr DEBUG: rec_res num : 20, elapsed : 0.09813570976257324
ocr = PaddleOCR(use_gpu=False)的运行记录:
[2023/09/18 14:06:47] ppocr WARNING: Since the angle classifier is not initialized, it will not be used during the forward process
[2023/09/18 14:06:48] ppocr DEBUG: dt_boxes num : 20, elapsed : 0.7001590728759766
[2023/09/18 14:06:53] ppocr DEBUG: rec_res num : 20, elapsed : 5.626152753829956
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。