当前位置:   article > 正文

python 遇到NLTK-Resource punkt not found 问题_please use the nltk downloader to obtain the resou

please use the nltk downloader to obtain the resource: import nltk nltk.down

python 遇到NLTK-Resource punkt not found 问题

在使用

  1. import nltk
  2. from nltk import data

时遇到

 Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:

  >>> import nltk
  >>> nltk.download('punkt')
  
  For more information see: https://www.nltk.org/data.html

  Attempted to load tokenizers/punkt/english.pickle

  Searched in:.............

...........................................

....................................(省略)

解决办法:

使用解释器命令行(即python交互模式),输入


import nltk
nltk.download()


会出现一个交互式对话框


将Server Index改为 http://www.nltk.org/nltk_data/
下载的目录会默认到本项目中的venv文件夹下,并自创一个nltk_data文件夹        (也可以直接放到d盘下,或者/python/Lib/目录下,一个nltk_data文件夹) 

在上方all package选项中找到想要的包进行下载,如果全部想选则在默认页面中选择all, 时间会久一些,建议随用随下
点击下载,

下载punkt 的话选择【Models】模块,选择【punkt】,点击【download】,进入下载状态,

会出现一些错误,如果出现“找不到raw.githubusercontent.com 的服务器 IP 地址”这个错误,则
在C:\Windows\System32\drivers\etc路径下找到hosts文件

raw.GitHub的ip经常更换,所以我们先去查一下该网址IP,点击IP查询然后输入

raw.githubusercontent.com

修改hosts文件

位置:C:\Windows\System32\drivers\etc\hosts

打开后在最后添加:# GitHub raw & imag
***.***.***.*** raw.githubusercontent.com    (下划线处填查找到的ip)     

因为是系统文件不能直接保存,可以先另存到桌面(文件名为hosts)(没有后缀),然后将原来的hosts删除,将桌面的(修改后的移进去)    

保存后再使用
import nltk
nltk.download()

命令重新启动下载就好了。
 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/426124
推荐阅读
相关标签
  

闽ICP备14008679号