当前位置:   article > 正文

requests的代理使用_requests 代理

requests 代理
  1. import requests
  2. from lxml import etree
  3. headers = {
  4. 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
  5. }
  6. url = 'https://www.sogou.com/web?query=ip'
  7. #使用代理服务器发起请求
  8. #proxies={'代理类型':'ip:port'}
  9. page_text = requests.get(url=url,headers=headers,proxies={'https':'42.57.150.150:4278'}).text
  10. tree = etree.HTML(page_text)
  11. data = tree.xpath('//*[@id="ipsearchresult"]/strong/text()')[0]
  12. print(data)

如何获取代理

打开芝麻代理,注意这里有实名认证,不可恶意使用代理去攻击别人的网站,即通过代理也是可溯源的:API获取-芝麻HTTP代理

 

 

构建代理池,一个代理一般可以支持20-30次并发请求

  1. from bs4 import BeautifulSoup
  2. from lxml import etree
  3. import requests
  4. import time
  5. import random
  6. headers = {
  7. 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
  8. }
  9. #构建一个代理池,通过芝麻代理获取代理
  10. proxy_url = 'http://webapi.http.zhimacangku.com/getip?num=10&type=2&pro=&city=0&yys=0&port=1&pack=222763&ts=0&ys=0&cs=0&lb=1&sb=0&pb=4&mr=1&regions='
  11. json_data = requests.get(url=proxy_url,headers=headers).json()
  12. json_list = json_data['data']
  13. proxy_list = [] #代理池,每次请求,可以随机从代理池中选择一个代理来用
  14. for dic in json_list:
  15. ip = dic['ip']
  16. port = dic['port']
  17. n_dic = {
  18. 'https':ip+':'+str(port)
  19. }
  20. proxy_list.append(n_dic)
  21. url = 'https://www.sogou.com/web?query=ip'
  22. page_text = requests.get(url=url,headers=headers,proxies=random.choice(proxy_list)).text
  23. tree = etree.HTML(page_text)
  24. data = tree.xpath('//*[@id="ipsearchresult"]/strong/text()')[0]
  25. print(data)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/178410
推荐阅读
相关标签
  

闽ICP备14008679号