当前位置:   article > 正文

python爬虫2:利用Requests和 XPATH爬取猫眼电影TOP100榜单_python爬虫2:利用requests和 xpath爬取猫眼电影top100榜

python爬虫2:利用requests和 xpath爬取猫眼电影top100榜
  1. import requests
  2. from lxml import etree
  3. def get_one_page(url):#得到1页的数据
  4. headers = {
  5. 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
  6. }
  7. response=requests.get(url)
  8. if response.status_code == 200: # 页面正常响应
  9. return response.text # 返回页面源代码
  10. return None
  11. def save_data():
  12. for i in range(0,10):#多页爬取
  13. url = 'https://maoyan.com/board/4?offset='+str(i*10)
  14. html = get_one_page(url)
  15. s = etree.HTML(html)
  16. titles = s.xpath('//*[@id="app"]/div/div/div/dl/dd/div/div/div[1]/p[1]/a/text()')#返回的是一个列表
  17. for title in titles:#把数据每一条提取出来并保存数据
  18. print(title)
  19. with open('manyan1.txt','a',encoding='utf8') as f:#保存爬取的数据到txt文档
  20. f.write(title+'\n')
  21. if __name__ =='__main__':
  22. save_data()#开始爬虫

1.本文利用Requests与XPATH爬取猫眼电影TOP100的榜单

2.由于本人初学爬虫有什么不对的地方请指正

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/372051
推荐阅读
相关标签
  

闽ICP备14008679号