赞
踩
爬虫步骤拆解:
1、分析目标网页,确定爬取的URL路径,header参数:打开网页地址,右击–检查,Network–Hide data URLs(筛选功能)–XHR并在headers下获取user-agent、cookie参数
2、发送请求-requests 模拟浏览器发送请求,获取响应数据,此时获取的数据就是源代码中response的内容
3、爬取数据-json模块,把json字符串转化为python可交互的数据类型
1)、数据转换
2)、数据
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。