当前位置:   article > 正文

scrapy_redis起始url需要参数时解决办法_scrapy redis 重写make_url_from_data

scrapy redis 重写make_url_from_data

scrapy_redis起始url访问时添加参数
scrapy_redis的起始访问是默认不带参数的,但大部分情况需要携带参数,解决办法就是重写make_request_from_data方法

class PinganSpider(RedisSpider):  # scrapy.Spider)
    redis_key = '爬虫名:start_urls'
    # 重写make_requests
    def make_request_from_data(self, data):
        req_data = json.loads(data)
        print(req_data)
        url = req_data['url']
        print(url)
        return scrapy.FormRequest(
            url,
            formdata=req_data['data'],
            # meta={'req_data': req_data}
        )
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

redis调度器写入:

lpush 爬虫名:start_urls '{"url": "起始url", "data": json格式的数据}'
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/433051
推荐阅读
相关标签
  

闽ICP备14008679号