当前位置:   article > 正文

lxml.html和lxml.etree将string解析成htmlTree的问题_lxml etree html.fromstring

lxml etree html.fromstring

一开始使用lxml.html.fromstring(),解析后到使用getroot时提示目标对象是一个htmlElement,这和说明文档里写的不一样啊…后来改用lxml.etree.fromstring(),报错解析不了,猜想是字符编码的问题,于是指定parser替换默认parser:

parser = etree.HTMLParser(encoding="utf-8")
html_tree = lxml.etree.fromstring(data, parser=parser)
  • 1
  • 2

解析成功,之后再从根节点一个个提取每个node中的text就行了。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/1006294
推荐阅读