当前位置:   article > 正文

python抓取页面文本及图片超链接_beautfsoup python 处理图片超链接

beautfsoup python 处理图片超链接

这里用到第三方库:Beautiful Soup(一个可以从HTML或XML文件中提取数据的Python库)

目标网页[baidu]:

在这里插入图片描述

一、爬取网页全部标签网址:

1、按F12进入开发者模式查看HTML:

找到目标超链接标签位置,方法如下GIF
在这里插入图片描述我们找到的超链接信息如下:
在这里插入图片描述

2、分析HTML结构:

在HTML中,超链接用a表示,链接地址写作 href=“…”,格式如下:
<a href="http://news.baidu.com" name="tj_trnews" class="mnav">新闻</a>

3、代码如下:

import requests  #获取网页
from bs4 import BeautifulSoup  #解析网页
url = "https://www.baidu.com/"
headers = 
  • 1
  • 2
  • 3
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/650349
推荐阅读
相关标签
  

闽ICP备14008679号