赞
踩
【Python爬虫】彼岸桌面 1080P 壁纸爬虫
以下代码可以爬取彼岸桌面几乎全部 1080P 壁纸共两万张左右,为了减小网站的压力,我设置了 time.sleep() 。下载后的壁纸会存放在 D:\bizhi 目录下,鉴于前几年的壁纸内容质量低,建议把代码中6146改成20000左右的数字。
from requests_html import HTMLSession import re import time os.mkdir('D:\\bizhi') session = HTMLSession() for i in range(6146,22654): time.sleep(1) try: url001 = 'http://www.netbian.com/desk/' url002 = '-1920x1080.htm' url = url001 + str(i) +url002 r = session.get(url) imgs = re.findall('http://img.*?jpg',r.text) pic_url = imgs[2] pic = session.get(pic_url) open('D:\\bizhi\\'+str(i)+'.jpg','wb').write(pic.content) print(i) except: print('Error')
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。