赞
踩
在使用
- import nltk
- from nltk import data
时遇到
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('punkt')
For more information see: https://www.nltk.org/data.html
Attempted to load tokenizers/punkt/english.pickle
Searched in:.............
...........................................
....................................(省略)
解决办法:
使用解释器命令行(即python交互模式),输入
import nltk
nltk.download()
会出现一个交互式对话框
将Server Index改为 http://www.nltk.org/nltk_data/
下载的目录会默认到本项目中的venv文件夹下,并自创一个nltk_data文件夹 (也可以直接放到d盘下,或者/python/Lib/目录下,创一个nltk_data文件夹)
在上方all package选项中找到想要的包进行下载,如果全部想选则在默认页面中选择all, 时间会久一些,建议随用随下
点击下载,
下载punkt 的话选择【Models】模块,选择【punkt】,点击【download】,进入下载状态,
会出现一些错误,如果出现“找不到raw.githubusercontent.com 的服务器 IP 地址”这个错误,则
在C:\Windows\System32\drivers\etc路径下找到hosts文件
raw.GitHub的ip经常更换,所以我们先去查一下该网址IP,点击IP查询然后输入
raw.githubusercontent.com
位置:C:\Windows\System32\drivers\etc\hosts
打开后在最后添加:# GitHub raw & imag
***.***.***.*** raw.githubusercontent.com (下划线处填查找到的ip)
因为是系统文件不能直接保存,可以先另存到桌面(文件名为hosts)(没有后缀),然后将原来的hosts删除,将桌面的(修改后的移进去)
保存后再使用
import nltk
nltk.download()
命令重新启动下载就好了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。