赞
踩
1、前言:上一篇写了如何用python的pytesseract库识别登录验证码,发现pytesseract识别出来并不是很准确;如果仅仅是数字的话,用ddddocr准确率更高,识别咔咔准~
2、那么,我们就先来安装ddddocr库:
pip install ddddocr
3、安装成功后,在获取验证码接口的响应数据中提取验证码的值,为base64格式
4、使用ddddocr来识别图片验证码,以下是一个示例代码:
- import ddddocr
- import base64
- def convert_png(captcha_value)
- image = captcha_value.split(",")[1] #只需要captcha_value中“base64”后面的
- img = base64.b64decode(image) #将base64转换成图片
- with open('captcha.png','wb') as f: #打开图片
- f.write(img) #保存图片
-
- #利用ddddocr识别验证码图片上的字符
- ocr = ddddocr.DdddOcr() #实例化对象
- code = ocr.classification(img) #识别图片上的字符
- return code
-
执行后报错“欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com...”
将第10行修改如下:
ocr = ddddocr.DdddOcr(show_ad=False)
5、识别出图片
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。