当前位置:   article > 正文

爬虫例子及知识点(scrapy知识点)

爬虫spiders规则怎么写
新知识:
新建一个scrapy项目:scrapy startproject xxx(项目名称)
运行一个scrap y项目: scrapy crawl xxx(项目名称)

项目文件说明:
这里写图片描述
文件说明:
• scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)
• items.py 设置数据存储模板,用于结构化数据,如:Django的Model
• pipelines 数据处理行为,如:一般结构化的数据持久化
• settings.py 配置文件,如:递归的层数、并发数,延迟下载等
• spiders 爬虫目录,如:创建文件,编写爬虫规则

代码如下:
2016-10-21 14-57-47屏幕截图.png 2016-10-21 15-25-16屏幕截图.png




posted on 2016-12-17 17:10 Kilichko 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/Yemilice/p/6192676.html

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/686143
推荐阅读
相关标签
  

闽ICP备14008679号