当前位置:   article > 正文

python爬虫之创建属于自己的ip代理池

python爬虫之创建属于自己的ip代理池

在后续需求数据量比较大的情况下,自建一个ip代理池可以帮助我们获得更多的数据。

下面我来介绍一下整个过程

1.找到目标代理网站

  1. https://www.dailiservers.com/go/webshare
  2. https://proxyscrape.com/
  3. https://spys.one/
  4. https://free-proxy-list.net/
  5. http://free-proxy.cz/en/
  6. https://www.proxynova.com/proxy-server-list/
  7. https://github.com/clarketm/proxy-list
  8. https://github.com/opsxcq/proxy-list

2.解析网站获得免费的代理ip列表

使用解析网站或者是发送网络请求都可以

3.使用request中的参数proxies

如果代理不需要密码和用户名

  1. prox = {
  2. "http":"http://ip地址:端口号",
  3. "https":"http://ip地址:端口号"
  4. }

如果代理需要密码和用户名

  1. prox = {
  2. "http":"http://用户名:用户密码@ip地址:端口号",
  3. "https":"http://用户名:用户密码@ip地址:端口号"
  4. }

注意如果当你的格式 填写不正确的时候,也是会出现请求成功的,但是使用的是自己本机的ip,所以请注意使用时的格式填写

prox的使用

直接在requests中填写参数请求,proxies = prox

4.进行代理验证

大部分免费的代理都是不可以使用的,这里可以使用telnetlib进行验证

使用方法

  1. try:
  2. telnetlib.Telnet(ip, port=端口号, timeout=3)
  3. except:
  4. print('ip无效!')
  5. else:
  6. print("有效)

建议将可以使用的ip储存到文件中,以便后续的使用,可以减少筛选的事件。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/525644
推荐阅读
相关标签
  

闽ICP备14008679号