当前位置:   article > 正文

python爬虫获取vpn代理

python爬虫获取vpn代理

下面代码是我写的一个vpn获取爬虫,在vscod上运行良好

  1. import lxml
  2. import requests
  3. from bs4 import BeautifulSoup
  4. from lxml import etree
  5. import os
  6. import json
  7. #如果当前目录下不存在'vpn.txt'这个文件,则创建'vpn.txt'这个目录
  8. if os.path.exists('vpn.txt'):
  9. os.mkdir('vpn.txt')
  10. if __name__=='__main__':
  11. #github上一个免费vpn获取项目,可以根据日期自行设置url
  12. url='https://github.com/sharkDoor/vpn-free-nodes/blob/master/node-list/2023-04/19%E6%97%A512%E6%97%B600%E5%88%86.md'
  13. head={
  14. 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
  15. 'AppleWebKit/537.36 (KHTML, like Gecko) '
  16. 'Chrome/112.0.0.0 Safari/537.36'
  17. }
  18. #发送请求获取页面内容
  19. response=requests.get(url=url,headers=head)
  20. response.encoding=response.apparent_encoding
  21. page_text=response.text
  22. #创建一个列表存储获取的vpn数据
  23. vpn_list=[]
  24. ##页面解析
  25. #创建etree对象
  26. tree=etree.HTML(page_text)
  27. #获取包含所有vpn的列表
  28. tbody_li=tree.xpath('//*[@id="readme"]/article/table/tbody/tr')
  29. #遍历并将vpn数据存入文件中
  30. with open('./vpn.txt','w') as f:
  31. for li in tbody_li:
  32. #对每个vpn的属性进行处理
  33. vpn=li.xpath('./td/text()')
  34. agreement=vpn[0]
  35. Region=vpn[1]
  36. ip=vpn[2]
  37. port=vpn[3]
  38. password=vpn[4]
  39. link=vpn[5]
  40. vpn_list.append(ip+':'+port)#存储vpn到列表中
  41. f.write(ip+':'+port+',')
  42. f.close()
  43. # #2.
  44. # #创建beautifulsoup对象
  45. # soup=BeautifulSoup(page_text,'lxml')
  46. # tbody_li=soup.select('#readme > article > table > tbody >tr ')
  47. # with open('./vpn.txt','w') as f:
  48. # for li in tbody_li:
  49. # #对每个vpn的属性进行处理
  50. # agreement=li.select('td')[0].string
  51. # Region=li.select('td')[1].string
  52. # ip=li.select('td')[2].string
  53. # port=li.select('td')[3].string
  54. # password=li.select('td')[4].string
  55. # link=li.select('td')[5].string
  56. # f.write(ip+':'+port+',')
  57. # f.close()

 若有任何错误,可在评论区进行讨论,希望大家一起进步!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/811459
推荐阅读
相关标签
  

闽ICP备14008679号