赞
踩
NLTK 提供了使用最普遍的停用词表
import nltk
# nltk.download('stopwords')
stop_words = nltk.corpus.stopwords.words('english')
print(len(stop_words))
print(stop_words[:7])
print([sw for sw in stop_words if len(sw) == 1])
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。