当前位置:   article > 正文

基于Python爬虫的豆瓣电影影评数据可视化分析_电影影评分析及可视化

电影影评分析及可视化

文章目录


前言

       本文以电影《你好,李焕英》在豆瓣上的影评数据为爬取和分析的目标,利用python爬虫技术对影评数据进行了爬取,使用pandas库进行了数据清洗,使用jieba库进行分词,使用collections库进行词频统计,使用wordcloud库绘制词云图,使用matplotlib库绘制了评论人所在城市占比饼状图,并使用matplotlib库绘制了评论数量随时间变化折线图。


一、数据抓取

      本文的目标网址为https://movie.douban.com/ subject/34841067/comments。通过观察其他电影影评的url并对比发现,每个subject/后面都有一 个固定的数字代表某一部特定的电影34841067代表的电影就是《你好,李焕英》。数据抓取的流程本文不再赘述,主要就是分析网页找到目标数据所在的url,然后想目标url发送请求

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/677022
推荐阅读
相关标签
  

闽ICP备14008679号