当前位置:   article > 正文

NLTK异常问题 [nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo_urlopen error [errno 11004] getaddrinfo failed

urlopen error [errno 11004] getaddrinfo failed

[nltk_data] Error loading reuters: urlopen error [Errno 11004] [nltk_data] getaddrinfo failed

在学习NLP项目时,经常会用到nltk工具包,但经常在import后使用的时候出现报错的情况
在这里插入图片描述
我们可以看到在错误提示里有让我们去download(‘reuters’)
但是按照提示的方法去下载时会报如下错误

import nltk
nltk.download('reuters')
  • 1
  • 2

在这里插入图片描述

出现这样的问题时要怎么解决?很多人都走错了思路导致浪费了不少时间在这上面。
主要的原因是无法解析raw.githubusercontent.com这个域名,这时我们可以使用代理的方式去连接到这个地址,或者修改host文件的域名地址映射,或者手动下载后解压到指定目录,详情如下:

解决办法

1.设置系统代理

把nltk.download()替换为:

nltk.set_proxy('SYSTEM PROXY')
nltk.download()
  • 1
  • 2

2.修改host文件

在 C:\Windows\System32\drivers\etc 路径下找到hosts文件,并在最后添加 199.232.68.133 raw.githubusercontent.com IP地址,并保存(注意:使用管理员打开&

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/750981
推荐阅读
相关标签
  

闽ICP备14008679号