三方包引入
使用到了以下包:
爬虫 scrapy
网络测试 requests
数据分析 numpy和pandas
绘图 matplotlib和wordcloud
pip install scrapy
pip install requests
pip install numpy
pip install pandas
pip install matplotlib
pip install wordcloud
推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。
爬取数据
打开QQ音乐网页版的分类歌单界面,乍一看,一分析网页源码,看到下图:
那么看来它就是使用动态填充的,那么它肯定就调用了接口,请求数据,那么就去找,在检查里的network中找啊找,最终找到了它:
然后写上代码,经过调试,终于成功了。
最后我把它保存成一个csv文件,通过播放量排序,截取前20,得到了下图
分析数据
对于这个数据的处理,就用到了numpy和pandas以及matplotlib。经过分析得出下图结果:
播放次数分析
标签分析