赞
踩
Python数据分析项目案例: 电影Top100榜单分析
内容简介:
对猫眼电影网站的Top100榜单进行数据分析,寻找好电影中隐藏的规律和价值。
源数据:
一份从猫眼电影网站爬取的csv文件。
字段:电影名,主演,上映时间及地区,平均,时长。
记录:100个按评价排序的好电影
部分截图:
相关工具:
excel、python
分析内容:
分析1: Top100电影地区分布
分析2: Top100电影上映年份分布
分析3: Top100电影风格分布
分析4:铸就经典!谁是好电影保障?
01导入库、整体风格设置=
说明:
02导入数据
2.df.info()得数据不存在缺失值
1.将’上映时间及地区’列 分成 ‘上映年份’和’上映地区’两列
2.将’上映地区’列中的’中国香港’改为’中国’,‘法国戛纳’改为’法国’
3.成功得出需要的格式
分析1: Top100电影地区分布
代码:
可视化:
结论:结果估计和大家的预料差不多,虽然此数据是由大多数中国网友投票得出的,但是美国还是几乎包揽了榜单的一半。毕竟美国作为电影制造大国,无论从制作水平,剧情设置,硬件设备等方面都远远领先其他国家,我们熟知的好莱坞也是大片频出。值得一提的是,日本的上榜数竟然有10部电影之多(国内也才16部)看来中国影迷对日本电影还是有不错的评价的。
分析2: Top100电影上映年份分布
代码2.1:
可视化2.1:
代码2.2:
可视化2.2:榜单前20
结论:
分析3: Top100电影风格分布
代码:
可视化结果:
结论:
越小众,占比越少(恐怖片,歌舞片),越大众,占比越多(爱情,喜剧)。这个风格分布其实和全部电影(不只是前100)的分布相似。本身基数小的小众风格先天不足,很难在这个榜单中占据多数,而剧情、爱情、喜剧这类老少皆宜,大家都爱看,大家都爱拍的电影基数特别大,能够占据更多的位置是情理之中。
分析4:铸就经典!谁是好电影保障?
代码:在榜单中出现次数超过3次的演员
结果:用了excel展示(比较舒服)
结论:
在学习python中有任何困难不懂的可以微信扫描下方CSDN官方认证二维码加入python交流学习
多多交流问题,互帮互助,这里有不错的学习教程和开发工具。
(python兼职资源+python全套学习资料)
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
检查学习结果。
最后,千万别辜负自己当时开始的一腔热血,一起变强大变优秀。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。