赞
踩
使用scrapy框架抓取某妹子图网时,只能抓取第一页,第二页报错
[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'www.xxxx.com': <GET http://www.xxxx.com/ent/meinvtupian/list_11_2.html>
度娘找到答案:
因为 Request中请求的 URL 和 allowed_domains 中定义的域名冲突,所以将Request中请求的URL过滤掉了,无法请求
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。