当前位置:   article > 正文

python数据挖掘电影评分分析_豆瓣电影数据与票房数据分析

python数据挖掘电影预测分析

写在前面

在上次观看了比利.林恩的中场战事之后,开始进入了豆瓣的电影世界,对于一个新用户来说,特别喜欢豆瓣电影的影评,对于所看过的留下深刻印象的电影都在豆瓣上搜了一边,同一部电影,希望能看到与自己感受不同的观点,因为每一位观众都有着不一样的人生轨迹,看待事物的角度可能会有所不同,正是这种差异往往能引发思考。豆瓣的电影数据方面一直以来都比较权威,对于每一位热爱电影的观众来说都是很好的参考,受众小而专,影评和评分都比较客观。。吧!

关于数据

电影数据来源于豆瓣网站,已经爬完了所有的电影分类标签,总共抓取到的电影记录有34177条,其中没有电影评分的记录有6399条,这些都是经过去重和清理后的数据,清理指的是对于电视剧、真人秀、脱口秀等等的筛除,也就是说数据里仅仅包含电影。电影票房数据来源于电影票房数据库网站,记录不多,只有2577条,经过简单地去离群点与豆瓣电影数据混合后只剩下2353条。电影数据中包含电影名字、导演、主演、所属国家或者地区、电影类型、语言类型、评价人数、以及评分等等。

分析目的

从不同的角度来观测数据,查看各个参数之间的联系,发现实际的有趣的问题,大体上进行分析。

豆瓣的电影世界

一、从电影数量上观测数据

1、各国发行的电影总数

adb96acb75afdefcd0638bd0fc36050e.png

VigoLin

从直方图的显示来看,美国发行的电影数量最多,是位居第二的中国大陆的两倍还多,其次是日本、英国、香港、韩国…美国的电影数量在意料之中,美国经过漫长的电影发展史,到现在已经形成了庞大的专业“电影生产线”,韩国的电影数量有点出乎意料,只有1277部,当然这只是从所爬取的数据中观测到的。

2、21世纪各年度发行的电影数量

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/677015
推荐阅读
相关标签
  

闽ICP备14008679号