当前位置:   article > 正文

python从停用词txt文件中读取停用词到列表中_stopwords.txt

stopwords.txt


在读取停用此列表时遇到这行代码,记录理解过程:

#读取停顿词列表
stopword_list = [k.strip() for k in open('stopwords.txt', encoding='utf8').readlines() if k.strip() != '']
  • 1
  • 2

这一行代码有点长,用到的python知识点有:列表生成式、readlines和strip(),下文依次介绍。

列表生成式语法

[expr for iter_var in iterable] 
[expr for iter_var in iterable if cond_expr]
  • 1
  • 2

例子:

# -*- coding: UTF-8 -*-
lsit1=[x * x for x in range(1, 11)]
print(lsit1)
  • 1
  • 2
  • 3

结果为

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
  • 1

文件读取readlines

readlines()方法读取整个文件所有行,保存在一个列表(list)变量中,每行作为一个元素,但读取大文件会比较占内存。

f = open("a.txt")
lines = f.readlines()
print(type(lines))
for line in lines:
	print line
f.close()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

结果为:

<type 'list'>
Hello
Welcome
What is the fuck...
  • 1
  • 2
  • 3
  • 4

str.strip()字符串处理函数

Python strip() 方法用于移除字符串头尾指定的字符(默认为空格)或字符序列。

注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。

strip() 处理的时候,如果不带参数,默认是清除两边的空白符,例如:/n, /r, /t, ’ ')。

再回头看这行代码就可以读懂了。
参考博客:
https://www.runoob.com/python3/python3-string-strip.html
https://blog.csdn.net/AliceGoToAnother/article/details/79119049

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/617457
推荐阅读
相关标签
  

闽ICP备14008679号