赞
踩
爬虫利器BeautifulSoup中find和find_all的使用方法
二话不说,先上段HTML例子
index
hello world使用BeautifulSoup前需要先构建BeautifulSoup实例
# 构建beautifulsoup实例
soup = BeautifulSoup(html,'lxml')
# 第一个参数是要匹配的内容
# 第二个参数是beautifulsoup要采用的模块,即规则
需要注意的是,导入对的模块需要事先安装,此处导入的LXML事先已经安装。可以导入的模块可通过查询BeautifulSoup的文档查看
接下来是find和find_all的介绍
1. find
只返回第一个匹配到的对象
语法:
find(name, attrs, recursive, text, **wargs)
# recursive 递归的,循环的
参数:
参数名
作用
name
查找标签
text
查找文本
attrs
基于attrs参数
例子:
# find查找一次
li = soup.find('li')
print('find_li:',li)
print('li.text(返回标签的内容):',li.text)
print(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。