赞
踩
昨天写爬虫爬取网页文本时出现以下问题:
- # ['', '.', '第一篇 100个高频词汇', '', '1 accelerate vt. (使)加速,增速', '', '11 assign vt.指派,选派;分配,布置(作业)', '', '【例】accelerate the rate of economic growth', '', '【派】assignment 作业', '', '加速经济增长', '', '12 assume vt.假象、假定', '', ]
-
- # <class 'str'>
明明看着是列表的,但是遍历的时候是一个数一个数的遍历。查看了一下类型原来是字符串,网上找了很多都是简单的字符串转列表的例子,放在这里都不管用。后来想出了一个方法,类似这种原理:
- a = "'baidu', 'nihao', 'kugou'"
-
- print(a)
- # <class 'str'>
-
-
- b = a.split(',')
-
- print("输出:"b)
- print(type(b))
-
-
- # 输出:["'baidu'", "'nihao'", "'kugou'"]
- # <class 'list'>
只要把外面两个中括号转化成( ”) 符号再用split对( ,)符号进行分割就成了列表。
然后对他进行遍历,把左右的(’‘)去掉就可以完美的拿取里面的文本了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。