当前位置:   article > 正文

selenium使用代理IP(1)

selenium使用代理IP(1)

}

res = requests.get(url=urls,headers=headers,proxies=proxies)

我想了半天没想好到底哪些网站反爬强,所以我就随便找一个网站来测试了,你可以再去尝试逛一下自己学校的教务管理系统,12360,facebook等…

目标网址:

https://www.taobao.com/

在这里插入图片描述

所以定位就很容易:

driver.find_element_by_name(‘q’)

之前写过一次使用代理玩爬虫,是requests模块,但是作为个人,我越往后面学,发现selenium用得反而越来越多,requests被逐渐抛弃一般,所以这里补充一个selenium添加代理。

方式很简单:

ops.add_argument(‘–proxy-server=http://%s’ % a) #添加代理

注意这里的a格式为:ip:port

注意: 使用代理ip需要安装模块selenium-wire:

pip install selenium-wire

你应该是:

from seleniumwire import webdriver

而不是:

from selenium import webdriver

比如在X宝搜索:XX手机

完整代码:

from selenium import webdriver

from fake_useragent import UserAgent

from selenium.webdriver.chrome.options import Options

headers = {‘User-Agent’: UserAgent().random}

ops = Options()

driver = webdriver.Chrome(r’D:\360安全浏览器下载\chromedriver.exe’)

api_url = ‘让你复制的代理api链接’

driver.get(api_url)

a = driver.find_element_by_xpath(‘/html/body/pre’).text # 获取代理

ops.add_argument(‘–proxy-server=http://%s’ % a) #添加代理

driver.delete_all_cookies() #清楚cookies

driver.get(‘https://www.taobao.com/’)

driver.find_element_by_name(‘q’).send_keys(‘华为手机’)

接下来是点击按钮:

在这里插入图片描述

确定点击的地方元素,然后使用click点击即可:

from selenium.webdriver import ActionChains

b= driver.find_element_by_class_name(‘search-button’) #定位搜索

ActionChains(driver).click(b).perform()

可能是触发了反扒机制吗?需要登录,我也不知道我的X宝账号密码,随便演示输入一下…剩下的自己操作

这里是账号密码分析:

在这里插入图片描述

在这里插入图片描述

所以定位账号密码如下,账号我设置的输入:chuanchuan,密码设置的输入:123456 瞎编的,具体根据你的实际账号来操作,我就不讲下去了,就是定位定位点点点

driver.find_element_by_name(‘fm-login-id’).send_keys(‘chuanchuan’) # 输入账号

driver.find_element_by_name(‘fm-login-password’).send_keys(‘123456’) # 输入密码

效果如下:

在这里插入图片描述

三、在selenium使用代理IP实战(二)


比如:

https://www.facebook.com/

分析账号密码:

在这里插入图片描述

在这里插入图片描述

代码为:

from fake_useragent import UserAgent

import requests

from selenium import webdriver

from selenium.webdriver import ChromeOptions

headers = {‘User-Agent’: UserAgent().random}

api_url = ‘复制你的api’

res = requests.post(api_url, headers=headers, verify=True)

PROXY = res.text

print(PROXY)

ops = ChromeOptions()

ops.add_argument(‘–proxy-server=%s’ % PROXY) # 添加代理

driver = webdriver.Chrome(r’D:\360安全浏览器下载\chromedriver.exe’)

driver.get(“https://m.facebook.com/”)

driver.find_element_by_name(‘email’).send_keys(“川川”)

driver.find_element_by_name(‘pass’).send_keys(‘123456’)

效果如下:

在这里插入图片描述

后续操作不继续演示,可以根据我讲的selenium知识点自行操作,无非就是点点点定位定位保存保存。

三、selenium单个元素定位实战复习


3.1 定位填写

以微软搜索引擎为例:

https://cn.bing.com/?mkt=zh-CN

分析:

在这里插入图片描述

所以:

from selenium import webdriver

driver = webdriver.Chrome(r’D:\360安全浏览器下载\chromedriver.exe’)

driver.get(‘https://cn.bing.com/?mkt=zh-CN’)

driver.find_element_by_name(‘q’).send_keys(‘川川菜鸟’)

如下:
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)

…(img-rMFZTHJN-1712950909715)]

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)

img
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/668347
推荐阅读
相关标签
  

闽ICP备14008679号