当前位置:   article > 正文

(2)python+selenium第二个自动化脚本:获取猫眼电影排名前100_猫眼电影自动抢票脚本

猫眼电影自动抢票脚本
从猫眼电影的排行中,选出排名在前十页的电影信息,包括:
 排名:1
URL://ms0.meituan.net/mywww/image/loading_2.e3d934bf.png
片名:霸王别姬
                主演:张国荣,张丰毅,巩俐
        上映时间:1993-01-01(中国香港)
得分:9.6

      '''

主要用到request库(自己在cmd下进入python的pip目录,用pip install request命令安装),还有正则表达式的使用,最后把信息写入文件

  1. from selenium import webdriver
  2. import re,requests
  3. #打开浏览器
  4. user_agent='Mozilia(compatible;MSIE5.5;Windows NT)'
  5. headers={'User-Agent':user_agent}
  6. for i in range(10):
  7. #页数改变
  8. url='http://maoyan.com/board/4?offset='+str(i*10)
  9. #获取网页内容,找出符合正则表达式条件的内容
  10. f=requests.get(url)
  11. html=f.text
  12. pic_url=re.findall('<dd>.*?board-index.*?>(.*?)</i>.*?src="(.*?)".*?<p class="name"><a.*?>(.*?)</a>.*?star.*?>(.*?)</p>.*?releasetime.*?>(.*?)</p>.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>',html,re.S)
  13. #两个正则表达式不用任何符号相连,或者可以认为是.*?来连接。多个字符串输出时是列表的形式item[i]
  14. #法一输出:列表形式[(.....)]---->print(pic_url)
  15. #法二输出:输出多个变量值----->item[i],并写入文件保存
  16. file=open('maoyandy.txt','ab')
  17. for item in pic_url:
  18. print("排名:%s\n\tURL:%s\n\t片名:%s%s%s\n\t得分:%s%s\n"%(item[0],item[1],item[2],item[3],item[4],item[5],item[6]))
  19. for i in range(7):
  20. file.write(item[i].encode('utf-8'))
  21. else:
  22. print('抓取成功')
  23. '''
  24. 排名:1
  25. URL://ms0.meituan.net/mywww/image/loading_2.e3d934bf.png
  26. 片名:霸王别姬
  27. 主演:张国荣,张丰毅,巩俐
  28. 上映时间:1993-01-01(中国香港)
  29. 得分:9.6
  30. '''

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/371959
推荐阅读
相关标签
  

闽ICP备14008679号