当前位置:   article > 正文

安装nltk包(报错缺失punkt error 11004)_nltk中punkt安装

nltk中punkt安装

问题描述:

安装不了nltk;在运行NLTK的时候报错了,找不到punkt 文件,想要下载,运行代码nltk.dowload('punkt')也报错。

安装步骤:

  1. 通过pycharm下载nltk包(可搜索“pycharm安装第三方库”)

  1. 测试运行后通常报错('resource punkt not found')。所以需要下载punkt包,并放在nltk_data文件夹内

  1. 在GitHub上下载整个nltk包(此过程大概5min)(punkt的zip无法直接下载)

访问官方github: https://github.com/nltk/nltk_data.

  1. 将里面的packages文件夹解压在报错时提到的任意一个目录里面,并重命名为nltk_data(发现找不到nltk_data文件夹,所以需要在指定位置新建该文件夹)

  1. 在刚解压的文件夹里面找到punkt文件夹,将里面的punkt压缩包解压

  1. 运行测试即可

其他可能有用的方法:

  1. 科学上网

根据"推荐”代码直接下载punkt包报错,科学上网后显示punkt下载好。

  1. #直接下载报错
  2. [nltk_data] Error loading reuters: <urlopen error [Errno 11004]
  3. [nltk_data] getaddrinfo failed>
  4. #科学上网后
  5. [nltk_data] Downloading package reuters to
  6. [nltk_data] C:\Users\Mimas\AppData\Roaming\nltk_data...

与科学上网类似的方法如更改hosts设置好像也是同样道理

  1. 不确定是不是真的没有nltk_data文件夹,可使用两行python代码查找

  1. from nltk import data
  2. print(data.find('.'))

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/377554?site
推荐阅读
相关标签
  

闽ICP备14008679号