赞
踩
特点: 对于极验验证码3.0版本,我们首先点击按钮进行智能验证。如果验证不通过,则会弹出滑动的验证的窗口,拖动滑块拼合图像进行验证。之后三个加密参数会生成,通过表单提交到后台,后台还会进行一次验证。
极滑2.0的破解思路:
破解的重要点就是:识别滑动缺口的位置。
但是极滑3.0进行了更新,我们点击按钮进行智能验证,然后截图,但是获取到的不再是完整的原图,而是带有缺口的原图,这样子,我们就不能使用极滑2.0的办法来获取到滑动缺口的位置,需要另想获取滑动缺口的位置,下面有分别俩个办法来获取极滑3.0的缺口位置:
通过滑动小块按钮,从左边到右边,然后不断保存滑动过的轨迹和截图到的照片到字典中,通过照片分析,找到其中没有凹槽的图片,也就是将滑块移动到符合位置的轨迹,至于怎么在那么多截图中找到最合适的那种找完美的图片,这个就需要图片处理的算法,这个下次再弄,这次尝试了方法一。
chaojiying.py: 需要使用到超级鹰平台,读者可以看我上一篇博客,有讲到如何注册使用,在geetest_spider.py中需要用到超级鹰的账号、密码、软件ID,这个模块就无要更改
import requests from hashlib import md5 class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username self.password = md5(password.encode("utf-8")).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 图片字节 codetype: 题目类型 参考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:报错题目的图片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() if __name__ == '__main__': # todo:用户中心>>软件ID 生成一个替换 96001 chaojiying = Chaojiying_Client('超级鹰账号', '密码', '软件ID') # todo: 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// im = open('target.png', 'rb').read() # todo: 9101 验证码类型, 滑动验证码就不需要更改 result = chaojiying.PostPic(im, 9101) print(result)
geetest_spider.py:需要修改CrackGeetest类中的get_gap()方法中的超级鹰账号、密码以及软件ID
import time from io import BytesIO from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from chaogjiying import Chaojiying_Client from PIL import ImageFont from PIL import Image from PIL import ImageDraw EMAIL = 'cqc@cuiqingcai.com' PASSWORD = '123456' BORDER_1 = 8 BORDER_2 = 15 BORDER_3 = 28 class CrackGeetest(object): def __init__(self): self.url = 'https://account.geetest.com/login' self.browser = webdriver.Chrome() self.browser.maximize_window() self.wait = WebDriverWait(self.browser, 5) self.email = EMAIL self.password = PASSWORD self.success = False self.try_num = 3 self.now_num = 3 self.flesh_num = 1 def __del__(self): self.browser.close() def get_geetest_button(self): """ 获取初始验证按钮 :return: 初始化验证按钮 """ button = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'geetest_radar_tip'))) return button def get_position(self): """ 获取验证码位置 :return: 验证码位置元组 """ img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_img'))) time.sleep(0.5) location = img.location size = img.size top, bottom, left, right = location['y'], location['y'] + size['height'], location['x'], location['x'] + size[ 'width'] return top, bottom, left, right def get_screenshot(self): """ 获取网页截图 :return: 截图对象 """ screenshot = self.browser.get_screenshot_as_png() screenshot = Image.open(BytesIO(screenshot)) return screenshot def get_slider(self): """ 获取滑块 :return: 滑块对象 """ try: slider = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'geetest_slider_button'))) except Exception: self.crack() return return slider def get_geetest_image(self, name='captcha.png'): """ 获取验证码图片 :return: 图片对象 """ top, bottom, left, right = self.get_position() screenshot = self.get_screenshot() captcha = screenshot.crop((left, top, right, bottom)) captcha.save(name) return captcha def open(self): """ 打开网页输入用户名密码 :return: None """ self.browser.get(self.url) time.sleep(0.5) email = self.browser.find_elements_by_xpath("//i[@class='icon-email']/../../input")[0] password = self.browser.find_element_by_xpath("//i[@class='icon-password']/../../input") email.send_keys(self.email) password.send_keys(self.password) @staticmethod def get_track(distance): """ 根据偏移量获取移动轨迹 :param distance: 偏移量 :return: 移动轨迹 """ # 移动轨迹 track = [] # 当前位移 current = 0 # 减速阈值 mid = distance * 4 / 5 # 计算间隔 t = 0.2 # 初速度 v = 0 while current < distance: if current < mid: # 加速度为正2 a = 2 else: # 加速度为负3 a = -3 # 初速度v0 v0 = v # 当前速度v = v0 + at v = v0 + a * t # 移动距离x = v0t + 1/2 * a * t^2 move = v0 * t + 1 / 2 * a * t * t # 当前位移 current += move # 加入轨迹 track.append(round(move)) return track def move_to_gap(self, slider, track): """ 拖动滑块到缺口处 :param slider: 滑块 :param track: 轨迹 :return: """ ActionChains(self.browser).click_and_hold(slider).perform() for x in track: ActionChains(self.browser).move_by_offset(xoffset=x, yoffset=0).perform() time.sleep(0.5) ActionChains(self.browser).release().perform() @staticmethod def get_gap(): """ 通过超级鹰获取缺口位置 :return: 缺口距离 """ # todo:用户中心>>软件ID 生成一个替换 96001 chaojiying = Chaojiying_Client('超级鹰账号', '密码', '软件ID') # todo: 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// im = open('target.png', 'rb').read() # todo: 9101 验证码类型, 滑动验证码就不需要更改 result = chaojiying.PostPic(im, 9101) gap = int(result.get("pic_str").split(",")[0]) return gap # 超级赢验证失败,反馈回去,将不扣钱 @staticmethod def fail_to_chaojiying(): """ 超级赢验证失败,反馈回去,将不扣钱 :return: None """ # todo:用户中心>>软件ID 生成一个替换 96001 chaojiying = Chaojiying_Client('超级鹰账号', '密码', '软件ID') # todo: 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// im = open('target.png', 'rb').read() result = chaojiying.ReportError(im) @staticmethod def add_text_to_image(): """ 给截取的带缺口的图片添加“请点击凹槽左上角" :return: None """ # 设置字体样式 font = ImageFont.truetype("/usr/share/fonts/蓝杰ios加粗.ttf", 32) # 打开底版图片 imageFile = "captcha.png" im1 = Image.open(imageFile) # 在图片上添加文字 "请点击凹槽左上角" add_text = "请点击凹槽左上角" draw = ImageDraw.Draw(im1) draw.text((2, 120), add_text, "#FF0000", font=font) # 保存 im1.save("target.png") def crack(self): # 输入用户名密码 self.open() # 点击验证按钮 time.sleep(1) button = self.get_geetest_button() button.click() # BOREDER有俩种情况,一种是8,一种是15, 还有一种是28 def slider_try(gap, BORDER): if self.now_num: # 减去缺口位置 gap -= BORDER # 计算滑动距离 track = self.get_track(int(gap)) # 拖动滑块 slider = self.get_slider() self.move_to_gap(slider, track) try: self.success = self.wait.until( EC.text_to_be_present_in_element((By.CLASS_NAME, 'geetest_success_radar_tip_content'), '验证成功')) except Exception as e: self.now_num -= 1 test_num = self.try_num - self.now_num if self.now_num == 0: print("第%d次尝试失败, 验证失败" % test_num) else: print("验证失败,正在进行第%d次尝试" % test_num) while not self.success and self.now_num > 0: # 获取验证码图片 try: self.get_geetest_image() except Exception as e: # todo: 其他验证,或者是自动识别通过 self.success = True print("自动识别通过或者验证非滑动验证码,无需滑动%s" % e) time.sleep(5) return # 给验证码加文字 self.add_text_to_image() # 获取缺口位置 gap = self.get_gap() print("缺口位置gap为",gap) # 第一中请求,gap减少7 slider_try(gap, BORDER_1) # 成功后退出 if not self.success: # 尝试gap减少14 slider_try(gap, BORDER_2) if not self.success: slider_try(gap, BORDER_3) self.fail_to_chaojiying() if self.success: test_num = self.try_num - self.now_num + 1 print("第{}次刷新,第{}次尝试,验证通过".format(self.flesh_num, test_num)) time.sleep(5) self.success = True if not self.success: print("重新刷新页面,这是第%d次刷新" % self.flesh_num) self.flesh_num += 1 self.now_num = 3 self.try_num = 3 self.crack() if __name__ == '__main__': crack = CrackGeetest() crack.crack() del crack
次数 | 验证何时通过(每次刷新尝试最多3次机会) |
---|---|
1 | 第1次刷新,第1次尝试,验证通过 |
2 | 第2次刷新,第3次尝试,验证通过 |
3 | 第1次刷新,第2次尝试,验证通过 |
4 | 第1次刷新,第1次尝试,验证通过 |
5 | 第8次刷新,第1次尝试,验证通过过 |
6 | 第1次刷新,第3次尝试,验证通过 |
该验证的通过率,取决于超级鹰平台的返回的坐标,不过从结果可以看出来,基本都是要识别好几次,才可以成功,这个算法有点不行,可以通过celery异步让他处理,结果会更好,如果有机会,还不如自己写个识别图片凹槽的算法,感觉不会特别难
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。