赞
踩
分布式爬虫:概念介绍
需求:目标网站有 2w 个url,请求并处理这些 2w 个响应数据,然后入库
方案一:单服务器爬虫
方案二:分布式爬虫,协同
误区:多个单服务器爬虫 != 分布式爬虫
分布式爬虫的工作原理:
分布式爬虫:环境安装
1. scrapy安装 步骤:这个阶段,scrapy环境必须是完整的,安装过程略
2. python3安装scrapy-redis库
3. 安装 Redis 数据库
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。