赞
踩
什么是数据提取
简单的来说,数据提取就是从响应中获取我们想要的数据的过程
爬虫中数据的分类
结构化数据:json,xml等
处理方式:直接转化为python类型
非结构化数据:HTML
处理方式:正则表达式、xpath
下面以某网站首页为例,介绍结构化数据和非结构化数据
结构化数据例子:
非结构化数据:
XML数据:
<bookstore>
<book category
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。