赞
踩
同上篇爬虫练习-爬取小猪短租网北京地区短租房信息一样,均为极简的爬虫,仅仅爬取酷狗TOP500音乐信息(排名、歌手名、歌曲名、歌曲时长),可供入门和想入门的朋友学习。
本文为整理代码,梳理思路,并验证代码的有效性——2019.12.7
环境:
Python3(Anaconda3)
PyCharm
Chrome浏览器
主要模块:
BeautifulSoup
requests
time
先看一下请求网址
# TOP500 首页
https://www.kugou.com/yy/rank/home/1-8888.html?from=rank
别被这个下载客户端唬住了,经过测试,我们可以通过修改“ /home/ ”后跟的数字来访问后面的页数,如:
https://www.kugou.com/yy/rank/home/2-8888.html?from=rank # 第二页
https://www.kugou.com/yy/rank/home/3-8888.html?from=rank # 第三页
...
以此类推
一页有22首歌,我们可以推算出总共有23页。
# 构造多页URL
urls = ['http://www.kugou.com/yy/rank/home/{}
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。