赞
踩
一,携带本地缓存cookies启动
1,第一次启动先手动在要请求的网页输入账号信息等
2,之后正常启动,请求目标网站会自动添加cookies
- # 携带cookie启动
- option = webdriver.ChromeOptions()
- # 加载个人资料路径
- option.add_argument(r'user-data-dir=C:\Users\HH\AppData\Local\Google\Chrome\User Data\Default')
- driver = webdriver.Chrome(options=option) # 启动Chrome驱动
二,携带账号cookies启动
1, 先请求目标网站,保存cookies
- # 获取cookie
- driver = webdriver.Chrome()
-
- driver.get('https://www.qcc.com/')
-
- input('输入回车后继续:')
-
- with open('cookies_1.txt','w') as f:
- # 将cookies保存为json格式
- f.write(json.dumps(driver.get_cookies()))
-
- driver.close()
2,先请求目标网站, 读取刚刚保存下来的cookies文件再次去请求目标网站
- chrome_options = Options()
- chrome_options.add_argument('--no-sandbox')
- chrome_options.add_argument('--disable-dev-shm-usage')
- # chrome_options.add_argument('--headless')
- driver = webdriver.Chrome(options=chrome_options)
- # driver.maximize_window()
- driver.get('https://www.qcc.com/firm/eac35f7cb2922037a2f7e0525d8cf0cb.html')
-
- # 首先清除由于浏览器打开已有的cookies
- driver.delete_all_cookies()
-
- with open('cookies_1.txt','r') as f:
- # 使用json读取cookies 注意读取的是文件 所以用load而不是loads
- cookies_list = json.load(f)
-
- #将expiry类型变为int
- for cookie in cookies_list:
- # 并不是所有cookie都含有expiry 所以要用dict的get方法来获取
- if isinstance(cookie.get('expiry'), float):
- cookie['expiry'] = int(cookie['expiry'])
- driver.add_cookie(cookie)
- print('第二次请求')
- #重新发送请求(这步是非常必要的,要不然携带完cookie之后仍然在登录界面)
- driver.get('https://www.qcc.com/firm/eac35f7cb2922037a2f7e0525d8cf0cb.html')
- #sleep等待页面完全加载出来,这一步很关键
- time.sleep(6)
headers里的cookies:
- cookie = '网站cookie'
- cookie_list = []
- for i in cookie.split(';'):
- i_dict = {'name': i.split('=')[0].strip(), 'value': i.split('=')[1].strip()}
- cookie_list.append(i_dict)
- for c_i in cookie_list:
- driver.add_cookie(c_i)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。