当前位置:   article > 正文

Python实战(三)——Python解析器 BeautifulSoup使用_python中beautifulsoup用copy sector 定位关键字

python中beautifulsoup用copy sector 定位关键字

一、安装

1、进入python安装目录,如果scripts文件中有pip.exe则直接cmd 执行 pip install beautifulsoup4,开始安装

2、验证安装是否成功

 

  1. #coding :utf-8
  2. import bs4
  3. print bs4 #返回bs4信息,,<module 'bs4' from 'C:\Python27\lib\site-packages\bs4\__init__.pyc'>

返回bs4模块信息,beautifulsoup安装成功。

 

二、网页解析

 

  1. from bs4 import BeautifulSoup
  2. import re
  3. html_doc="""
  4. """
  5. #创建bs对象
  6. soup=BeautifulSoup(html_doc,'html_parser',from_encoding='uft-8') #html内容,解析器,编码
  7. #获取所有url
  8. links=soup.find_all('a')
  9. for link in links:
  10. print link.name,link['href'],link.get_text()
  11. #获取指定url
  12. link=soup.find('a',href='http://baidu.com')
  13. print link.name,link['href'],link.get_text()
  14. #根据正则表达式筛选
  15. link=soup.find('p',href=re.compile(r"titl"))
  16. print link.name,link['href'],link.get_text()
  17. #获取p段落文字
  18. p_node=soup.find('p',class_='title') # a标签里的class名="title"
  19. print p_node.name,p_node.get_text()

 

 

 

 

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/372901
推荐阅读
相关标签
  

闽ICP备14008679号