赞
踩
//
的用途
//a
当前html页面上的所有的abookstore//book
bookstore下的所有book元素@
的使用
//a/@herf
所有a的hreftext()
的使用
//a/text()
获取所有的a下的文本text()
的使用
//a/text()
获取所有的a下的文本//a[text()=下一页]
获取文本为下一页的a标签xpath查找特定的节点
//a[1]
选择第一个a标签//a[last()]
选择最后一个a标签//a[position()<4]
选择前三个a标签xpath的包含
//a[contains(text(),“下一页”)]
选择文本包含下一页三个字的a标签
//a[contains(@class, "n")]
选择class属性包含n的a标签
from lxml import etree
element = etree.HTML(html_str) # bytes或str类型的字符串
element.xpath("xpath_str") # 返回列表
etree.tostring(element) # 转化为字符串,查看与原始element是否有区别
# 数据提取时,先分组,再提取
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。