当前位置:   article > 正文

Scrapy框架-redis分布式(从Scrapy框架创建项目到redis分布式)_scrapy设置redis

scrapy设置redis
  •  盗墓笔记案例:

目标网址:http://www.daomubiji.com/

scrapy项目:

        1. 创建项目

        2. 创建爬虫

        3. 定义item

                数据内容:

                        1. 书的名称

                        2. 章节名称

                        3. 文本内容

        4. 编写spider

                1. 定义初始请求

                2. 解析响应内容

        5. 定义管道

        6. 运行项目

开始实现步骤Scrapy框架

 1. 创建项目CMD中可以实现

  1. #scrapy startproject '项目名称'
  2. scrapy startproject domu
  • 进入到domu项目

cd domu

2. 创建爬虫

  • 在domu项目中创建爬虫文件

  1. #scrapy genspider example example.com
  2. #example:表示的是爬虫的项目名称
  3. #example.com:表示的是初始化域名
  4. #开始创建
  5. scrapy genspider dm www.daomubiji.com

3. 定义item

  • 首先使用PyCharm或者Visual Studio Code打开刚刚创建的domu项目找到times.py文件并实现定义:

    • 数据内容:

                              1. 书的名称:book_title

                              2. 章节名称:chapter_name

                              3. 文本内容:content_text

  • </
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/408886
推荐阅读
相关标签
  

闽ICP备14008679号