当前位置:   article > 正文

python 识别图片验证码/滑块验证码准确率极高的 ddddorc 库_ddddocr滑块验证码

ddddocr滑块验证码

前言

验证码的种类有很多,它是常用的一种反爬手段,包括:图片验证码,滑块验证码,等一些常见的验证码场景。识别验证码的python 库有很多,用起来也并不简单,这里推荐一个简单实用的识别验证码的库 ddddocr (带带弟弟ocr)库.

环境准备

python 版本要求小于等于python3.9 版本 pip 安装

pip install ddddocr

下载的安装包比较大,一般用国内的下载源可以加快下载速度

pip install ddddocr -i https://pypi.douban.com/simple

github地址https://github.com/sml2h3/ddddocr

  如果你想学习接口自动化测试,我这边给你推荐一套视频,这个视频可以说是B站播放全网第一的接口自动化测试教程,同时在线人数到达1000人,并且还有笔记可以领取及各路大神技术交流:798478386    

【已更新】B站讲的最详细的Python接口自动化测试实战教程全集(实战最新版)_哔哩哔哩_bilibili【已更新】B站讲的最详细的Python接口自动化测试实战教程全集(实战最新版)共计200条视频,包括:1.【接口自动化】目前软件测试的市场行情以及测试人员能力标准。、2.【接口自动化】全面熟练Requests库以及底层方法调用逻辑、3.【接口自动化】接口自动化实战及正则和JsonPath提取器的应用等,UP主更多精彩视频,请关注UP账号。https://www.bilibili.com/video/BV17p4y1B77x/?spm_id_from=333.337&vd_source=488d25e59e6c5b111f7a1a1a16ecbe9a

快速开始

先随便找个纯英文的验证码,保持为a1.png

 代码示例

  1. import ddddocr # 导入 ddddocr
  2. ocr = ddddocr.DdddOcr() # 实例化
  3. with open('a1.png', 'rb') as f: # 打开图片
  4. img_bytes = f.read() # 读取图片
  5. res = ocr.classification(img_bytes) # 识别
  6. print(res)

运行结果

已经能识别到 xnen ,但是会出现"欢迎使用ddddocr,本项目专注带动行业内卷..."提示语, 可以加一个参数show_ad=False

  1. import ddddocr # 导入 ddddocr
  2. ocr = ddddocr.DdddOcr(show_ad=False) # 实例化
  3. with open('a1.png', 'rb') as f: # 打开图片
  4. img_bytes = f.read() # 读取图片
  5. res = ocr.classification(img_bytes) # 识别
  6. print(res)

图片验证码

识别一下三种验证码

 

 

代码示例

  1. import ddddocr # 导入 ddddocr
  2. ocr = ddddocr.DdddOcr(show_ad=False) # 实例化
  3. with open('a2.png', 'rb') as f: # 打开图片
  4. img_bytes = f.read() # 读取图片
  5. res2 = ocr.classification(img_bytes) # 识别
  6. print(res2)
  7. with open('a3.png', 'rb') as f: # 打开图片
  8. img_bytes = f.read() # 读取图片
  9. res3 = ocr.classification(img_bytes) # 识别
  10. print(res3)
  11. with open('a4.png', 'rb') as f: # 打开图片
  12. img_bytes = f.read() # 读取图片
  13. res4 = ocr.classification(img_bytes) # 识别
  14. print(res4)

 运行结果

  1. giv6j
  2. zppk
  3. 4Tskh

滑块验证码

滑块验证码场景如下场景示例

先抠出2张图片,分别为background.png 和 target.png 

 

 

解决问题的重点是计算缺口的位置

  1. import ddddocr
  2. det = ddddocr.DdddOcr(det=False, ocr=False, show_ad=False)
  3. with open('target.png', 'rb') as f:
  4. target_bytes = f.read()
  5. with open('background.png', 'rb') as f:
  6. background_bytes = f.read()
  7. res = det.slide_match(target_bytes, background_bytes, simple_target=True)
  8. print(res)

运行结果

{'target_y': 0, 'target': [184, 58, 246, 120]}

target 的四个值就是缺口位置的左上角和右下角的左边位置

识别中文

识别图片上的文字

  1. import ddddocr
  2. import cv2
  3. det = ddddocr.DdddOcr(det=True)
  4. with open("test.png", 'rb') as f:
  5. image = f.read()
  6. poses = det.detection(image)
  7. im = cv2.imread("test.png")
  8. for box in poses:
  9. x1, y1, x2, y2 = box
  10. im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
  11. cv2.imwrite("result.jpg", im)

 保存后的图片 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/466139
推荐阅读
相关标签
  

闽ICP备14008679号