当前位置:   article > 正文

快速解决Python问题:TypeError: list indices must be integers or slices, not str

typeerror: list indices must be integers or slices, not str

快速解决python问题:TypeError: list indices must be integers or slices, not str


前言序锦


正题:


  • 出现原因
  • 解决方法

在python的Beautiful Soup 4 扩展库的使用过程中出现了

TypeError: list indices must be integers or slices, not str

这个错误,这里分析一下为什么会报错以及如何解决问题。

这个错误的意思是“类型错误:list的索引必须是‘integers’或者‘slices’”
示例代码:
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

引入库
from bs4 import BeautifulSoup
读取页面
soup = BeautifulSoup(open(‘index.html’))
获取标签
img_tag = div.select(“img”)
获取标签属性(这里报错)
src = img_tag[‘src’]
输出
print(src)

检查对比后我发现错误原因:就是获取标签时获取的是list数据而不是tag

**主要原因如下:**
主要就是获取的内容和自己认为的有偏差
,也就是find()find_all()select()select_one()的区别。
当使用:
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

find()
select_one()

时,获取的是一个标签。类型为:
  • 1
  • 2


  • 1
  • 2

所以可以使用tag[‘class’]取值
当使用:

find()
select()
  • 1
  • 2

时获取的是组标签(就算只有一个标签也是一组),类型为:

find_all()的返回值类型
<class 'bs4.element.ResultSet'>
select()的返回值类型
<class 'list'>
  • 1
  • 2
  • 3
  • 4

这时,我们取值就需要先定位是list(ResultSet)中的那个标签在取值,例如tag[0][‘class’]

解决方法:

方法一:

#引入库
from bs4 import BeautifulSoup
#读取页面
soup = BeautifulSoup(open('index.html'))
#获取标签
img_tag = div.select("img")
#获取标签属性
src = img_tag[0]['src']
#输出
print(src)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

因为我知道页面中的结构可以确保获得的第一个bag为我需要的标签。所以使用src = img_tag[0][‘src’]来获取信息。

方法二:

#引入库
from bs4 import BeautifulSoup
#读取页面
soup = BeautifulSoup(open('index.html'))
#获取标签
img_tag = div.select_one("img")
#获取标签属性(这里有改动)
src = img_tag['src']
#输出
print(src)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

同上理,这样修改也是可以成功的。


在家忙碌之际,也不忘来更新一篇,大家一起努力!!!^-^

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/642868
推荐阅读
相关标签
  

闽ICP备14008679号