当前位置:   article > 正文

[nltk_data] Error loading stopwords: <urlopen error [Errno 11004] [nltk_data] getaddrinfo failed_[nltk_data] error loading stopwords:

[nltk_data] error loading stopwords:

出现报错:
ljx
按照提示输入代码:

import nltk
nltk.download('stopwords')
  • 1
  • 2

显示:
ljx
解决方法:

  • 简单办法:科学上网之后,再次运行代码。

亲测有效。

  • 不能科学上网:手动去GitHub上下载:

参考教程:
参考教程1
参考教程2

去Git上下载:
https://github.com/nltk/nltk_data/tree/gh-pages
https://github.com/nltk/nltk_data/tree/gh-pages/packages/corpora

找到语料库点进去下载,下载之后放置语料到报错里提到的第一个目录下。

ljx
nltk_data目录下面创建一个corpora文件夹,然后把解压后的数据放进去,记得数据一定要解压,一定要解压。

找不到报错里的路径的可以用下面代码查询路径:

import nltk
nltk.find('.')
#print(nltk.find('.'))
  • 1
  • 2
  • 3

放好之后可以测试一下:

from nltk.corpus import stopwords
stop_words = stopwords.words('english') #选择英文停止词 去重 得到英文停止词表
print(stop_words)
  • 1
  • 2
  • 3

ljx
成功。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/354215
推荐阅读
相关标签