当前位置:   article > 正文

动态爬取猫眼每年票房数前100的电影_xpath爬取猫眼电影前100

xpath爬取猫眼电影前100

依次进入每年的票房数页面,自动获取票房数前100的电影的排名,电影名,总票房数和平均票价。

根据元素的定位,可以看到其变化的规律,因此,建立循环,将获得的数据导入到csv文件中。

  1. from selenium import webdriver
  2. import numpy as np
  3. import time
  4. import pandas as pd
  5. driver = webdriver.Firefox()
  6. driver.get("https://piaofang.maoyan.com/rankings/year")
  7. time.sleep(1)
  8. for i in range(2,13): #依次进入每一年
  9. web='//*[@id="tab-year"]/ul/li[{}]'.format(i)
  10. driver.find_element_by_xpath(web).click()
  11. time.sleep(1)
  12. lis=[]
  13. txt=[]
  14. for j in range(1,101):
  15. xpath='//*[@id="ranks-list"]/ul[{}]'.format(j)
  16. context=driver.find_element_by_xpath(xpath) #得到相应年的数据
  17. contexts=context.text
  18. lis.append(contexts)
  19. for m in lis:
  20. txt.append(m.split("\n"))
  21. df= pd.DataFrame(txt, columns=['排名', '电影名', '上映时间','总票房数','平均票价','场均人次'])
  22. column=['上映时间','场均人次']
  23. df = df.drop(columns=column, axis=1)
  24. filename='{}年电影票房.csv'.format(2023-i+2)
  25. df.to_csv(filename, sep=',', header=True, index=False,encoding='utf-8-sig')

结果展示:

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/372037
推荐阅读
相关标签
  

闽ICP备14008679号