nltk.download(‘punkt‘)报错_nltk.download('punkt')

作者：小蓝xlanll | 2024-03-31 10:33:43

踩

nltk.download('punkt')

问题描述

在跑代码时，用到nltk库，但是出现如下问题：

import nltk

nltk.download('punkt')

For more information see: https://www.nltk.org/data.html

Attempted to load ?[93mtokenizers/punkt/english.pickle?[0m

Searched in:

- 'C:\\Users\\hp/nltk_data'

- 'D:\\anacoda\\python3.6.5\\nltk_data'

- 'D:\\anacoda\\python3.6.5\\share\\nltk_data'

- 'D:\\anacoda\\python3.6.5\\lib\\nltk_data'

- 'C:\\Users\\hp\\AppData\\Roaming\\nltk_data'

- 'C:\\nltk_data'

- 'D:\\nltk_data'

- 'E:\\nltk_data'

- ''

解决办法

在使用nltk这个工具包时，需要的数据通常是不能通过nltk.download('xxx')下载下来的，我们可以从官网http://www.nltk.org/nltk_data/上下载需要的数据，比如punkt、stopwords等等。打开网站 http://www.nltk.org/nltk_data/

选择download下载

在 C:\Users\xxx\AppData\Roaming 路径下创建文件夹 nltk_data，在nltk_data文件夹中再创建文件夹 tokenizers，punkt.zip 解压到C:\Users\xxx\AppData\Roaming\nltk_data\tokenizers 下，如下：

接下来进行测试

win+R cmd，输入python，再依次输入如下代码


import nltk
text=nltk.word_tokenize("Barack Hussein Obama, born on August 4, 1961, is an American Democrat politician, the 44th president of the United States, and the first African-American president in the history of the United States.")
print(text)

表示运行成功。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小蓝xlanll/article/detail/344323