当前位置:   article > 正文

python爬虫框架--scrapy 基本使用_2019-09-10 12:39:37 [scrapy.utils.log] info: scrap

2019-09-10 12:39:37 [scrapy.utils.log] info: scrapy 1.7.3 started (bot: bili

流程框架:

1、抓取第一页:请求第一页的URL并得到源代码,进行下一步分析。

2、获取内容和下一页链接:分析源代码,提取首页内容,获取下一页链接等待进一步爬取。

3、保存爬取结果:将爬取结果保存为特定格式入文本、数据库。

4、翻页爬取:请求下一页信息、分析内容并请求再下一页。

链接。 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/887445
推荐阅读
相关标签
  

闽ICP备14008679号