python爬虫防止IP被封的一些措施,强烈建议收藏转发_python爬虫被封ip

作者：繁依Fanyi0 | 2024-03-13 18:53:25

踩

python爬虫被封ip

python爬虫防止IP被封的一些措施

1.爬虫防止IP被封的一些措施
2.伪造User-Agen
3.在每次重复爬取之间设置一个随机时间间隔
4.伪造`cookies`
5.使用代理

1.爬虫防止IP被封的一些措施

在编写爬虫爬取数据的时候，因为很多网站都有反爬虫措施，所以很容易被封IP，就不能继续爬了。在爬取大数据量的数据时更是瑟瑟发抖，时刻担心着下一秒IP可能就被封了。

本文就如何解决这个问题总结出一些应对措施，这些措施可以单独使用，也可以同时使用，效果更好。

2.伪造User-Agen

在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问。比如：

headers = {
   'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}
resp = requests.get(url,headers = headers)
1
2
3

还可以先收集多种浏览器的User-Agent，每次发起请求时随机从中选一个使用，可以进一步提高安全性：

In [7]: import requests,random

In [8]: user_agents = [1
2

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/230050