赞
踩
scrapy-redis没被部署,感觉讲起来很无力;因为实在编不出一个能让scrapy-redis发挥用武之地的案子;所以,索性直接先把分布式爬虫的部署问题给讲清楚!! 然后,曲线救国式地再在部署的服务器上,讲scrapy redis我感觉这样才好!
现在还有不少人在用scrapy web进行爬虫管理,但我个人感觉是那玩意儿BUG挺多的;且不灵光!
而Gerapy和scrapy web都是基于scrapyd的,所以 我直接省去了去讲scrapy web的知识点,推荐这个Gerapy;当然了,还有其他的, 例如:"crawlab",也是用于爬虫管理的,你就忽悠忽悠老板,措辞我都给你想好了:' 这玩意儿老好了,真的,先进单位都在用~嘎嘎香;谁用谁知道,贼牛逼!! '-----让他给你买!
都是用于构建和管理 Scrapy 爬虫项目的工具,但它们有一些区别:
废话不多说,讲我们的:
- pip install scrapy==2.9.0
-
- pip install scrapyd
-
- #可自定义要不要按scrapy-redis,上面两个就是环境必须给他装的! 我推荐scrapy装2.9.0,
- #别升高了!!原因我前文讲过
-
- pip install gerapy
-
- #pip install gerapy_auto_extractor
进入到项目文件夹内,控制台:
- cd <你的项目文件夹内>
- gerapy init
初始化完成,出现:
gerapy migrate
出现对应的:表示成功!
gerapy migrate 命令的主要用途是将数据库结构与 Gerapy 项目的模型定义同步。它提供了以下几个重要的用途和好处:
gerapy initadmin
他会自动生成一个临时的管理员账户,如图:
- gerapy runserver 0.0.0.0:8000 #接受全部的ip,端口自定义
- #或者
-
- gerapy runserver 127.0.0.1:8080 #在本地地址绑定到端口 8080 上
图例:
在浏览器输入: 127.0.0.1:8000
弹出页面:
(第一次登录)输入用户名:admin 密码:admin
登录成功!
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。