lxml.html和lxml.etree将string解析成htmlTree的问题_lxml etree html.fromstring

作者：weixin_40725706 | 2024-08-20 08:58:18

踩

lxml etree html.fromstring

一开始使用lxml.html.fromstring()，解析后到使用getroot时提示目标对象是一个htmlElement，这和说明文档里写的不一样啊…后来改用lxml.etree.fromstring()，报错解析不了，猜想是字符编码的问题，于是指定parser替换默认parser：

parser = etree.HTMLParser(encoding="utf-8")
html_tree = lxml.etree.fromstring(data, parser=parser)
1
2

解析成功，之后再从根节点一个个提取每个node中的text就行了。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/1006294