赞
踩
nltk是常用的自然语言工具包,但是由于默认的服务器是基于https的,很难连接。在下载nltk包的尤其是使用nltk.download()图像化界面的时候,经常会碰到无法连接的情况,或者连接很慢。下面介绍两种方法解决这个问题。
方法一:在弹出的NLTK Downloader界面将Server Index里的内容改成NLTK官网http://www.nltk.org/nltk_data/这个服务器。替换后如下图:
方法二:下载第三方扩展包
step 1 : 下载扩展包,以下途径任选其一。
※ 注:如果不清楚Download Directory路径路径在哪,可通过以下步骤查找路径
① 输入以下代码
- import nltk
-
- nltk.find('.')
② 打印结果:
Searched in:
'C:\Users\15839/nltk_data'
'E:\python_env\nlp\nltk_data'
'E:\python_env\nlp\share\nltk_data'
'E:\python_env\nlp\lib\nltk_data'
'C:\Users\15839\AppData\Roaming\nltk_data'
'C:\nltk_data'
'D:\nltk_data'
'E:\nltk_data'
③ 将nltk_data文件夹移到上述任意文件路径即可。
step 3 : 解压nltk_data文件夹里面对应的每个语料库的压缩文件,即zip文件解压才能用。
step 4 : 打开jupyter,输入以下代码,若出现下图所示画面,说明安装成功。
- import nltk
- from nltk.book import *
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。