赞
踩
本次采集的目标是高考网(http://www.gaokao.com/gkpic/)的图片,实现图片自动下载。高考网主页如下图:
爬取的流程包括寻找数据接口,发送请求,解析图片链接,向图片链接发送请求获取数据,最后保存数据。
import urllib.request
from lxml import etree
from urllib.request import urlretrieve
import os
import sys
target_dir = r'D:\校花'
if os
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。