当前位置:   article > 正文

搜索引擎关键词抓取 以百度为例 python_百度相关搜索提取

百度相关搜索提取
上周晚上看了下一个高手利用python抓取搜索引擎的关键词提取的视频,自己动手也下了下,能实现简单的工作,分享给你们:
  1. #coding:utf-8
  2. '''
  3. Created on 2015年9月6日
  4. @author: Administrator
  5. '''
  6. import urllib2
  7. import urllib
  8. import re
  9. import time
  10. from random import choice
  11. iplist=['202.194.101.150','124.240.187.89','124.240.187.89']
  12. ip=choice(iplist)
  13. gic="众筹"
  14. gjc=urllib.quote(gic)
  15. url="https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd="+str(gjc)
  16. headers={"Get":url,
  17. "Host":"sp0.baidu.com",
  18. "Referer":"https://www.baidu.com/",
  19. "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.89 Safari/537.36"
  20. }
  21. proxy_support=urllib2.ProxyHandler({'http':'http://'+ip}) #代理
  22. opener=urllib2.build_opener(proxy_support) #代理
  23. urllib2.install_opener(opener) #代理
  24. req=urllib2.Request(url)
  25. for key in headers:
  26. req.add_header(key, headers[key])
  27. html=urllib2.urlopen(req).read()
  28. html_decode=html.decode("gbk")
  29. time.sleep(0.2)
  30. result=re.findall(""(.*?)"",html_decode)
  31. for item in result:
  32. print item
不懂的联系我  714947298
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/768237
推荐阅读
相关标签
  

闽ICP备14008679号