当前位置:   article > 正文

nltk_data无法下载或无法使用问题的解决方案之一_[nltk_data] error loading tokenizers: package 'tok

[nltk_data] error loading tokenizers: package 'tokenizers' not found

报错展示

Please use the NLTK Downloader to obtain the resource
LookupError:
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:

图片:
在这里插入图片描述

问题解决

本人使用的方法:

- 1 手动下载 nltk_data 数据压缩包

地址:https://github.com/nltk/nltk_data

- 2 解压压缩包,找到packages文件夹

在这里插入图片描述

- 3 将packages文件夹中的文件全部复制到nltk_data文件夹中

在这里插入图片描述

- 4 将这个 nltk_data 文件放到搜索的路径中去!!!(任选其一)

注意 : 文件夹的名一定要是 nltk_data
本人将 nltk_data 文件放到了:

  • C:\nltk_data
    在这里插入图片描述

- 5 进行测试:

测试1: 是否存在 nltk_data 文件
import nltk
from nltk.book import *
  • 1
  • 2

显示下图;说明正常
在这里插入图片描述

测试2: 是否可以使用nltk_data中的数据
import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
  • 1
  • 2

如果出现下图这种情况
在这里插入图片描述
我们需要将 tokenizers 中的 punkt.zip 解压,并且放到 本路径下,如图
在这里插入图片描述
重新进行测试:

import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
  • 1
  • 2

出现下图情况,说明nltk模块可以正常使用
在这里插入图片描述

解决方案迁移

同样的可以使用其他的 nltk_data 数据集,比如解决:出现没有 reuters 数据的问题!!

from nltk.book import *
from nltk.corpus import reuters
files = reuters.fileids()
print(files)
  • 1
  • 2
  • 3
  • 4

其他问题解决方案汇总:

下载 nltk_data 太慢问题

安装 访问加速器 (GitHub加速)

在这里插入图片描述

其他博客下载渠道

https://blog.csdn.net/qq_35164554/article/details/112669384
内有链接,可以高速下载

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号