当前位置:   article > 正文

【汇总】nltk相关资源包无法下载报错问题_resource omw-1.4 not found. please use the nltk do

resource omw-1.4 not found. please use the nltk downloader to obtain the res
  1. LookupError:
  2. **********************************************************************
  3. Resource xxx not found.
  4. Please use the NLTK Downloader to obtain the resource:
  5. >>> import nltk
  6. >>> nltk.download('xxx')

因为一些原因,下载不了nltk的相关数据,这个时候可以手工导入所需的资源

0. 相关语料数据

我收集了四份资源分别是punk,omw-1.4,stopwords,wordnet

下载链接

1. word_tokenize相关

1.1 报错代码

  1. from nltk.tokenize import word_tokenize
  2. a = "hello, world!"
  3. print(word_tokenize(a))

1.2 报错信息

缺失punkt。这里我的环境是ubuntu中的miniconda下的tf,我的用户名是username。我选择了下面搜索路径中的第二条路径,实际可以结合自身情况修改。

  1. LookupError:
  2. **********************************************************************
  3. Resource punkt not found.
  4. Please use the NLTK Downloader to obtain the resource:
  5. >>> import nltk
  6. >>> nltk.download('punkt')
  7. For more information see: https://www.nltk.org/data.html
  8. Attempted to load tokenizers/punkt/PY3/english.pickle
  9. Searched in:
  10. - '/home/username/nltk_data'
  11. - '/home/username/miniconda3/envs/tf/nltk_data'
  12. - '/home/username/miniconda3/envs/tf/share/nltk_data'
  13. - '/home/username/miniconda3/envs/tf/lib/nltk_data'
  14. - '/usr/share/nltk_data'
  15. - '/usr/local/share/nltk_data'
  16. - '/usr/lib/nltk_data'
  17. - '/usr/local/lib/nltk_data'
  18. - ''
  19. **********************************************************************

1.3 解决方法

在相应的环境下(这里我的环境是tf)创建nltk_data文件夹,并在下面创建tokenizers文件夹,再将punkt文件夹放入。最终路径为(我选择了搜索路径中的第二条路径,实际可以结合自身情况修改)

/home/username/miniconda/envs/tf/nltk_data/tokenizers/punkt

2. lemmatize相关

2.1 报错代码

  1. from nltk.stem.wordnet import WordNetLemmatizer
  2. stem_wordnet = WordNetLemmatizer()
  3. print(stem_wordnet.lemmatize("goes"))

2.2 报错信息

缺失wordnet。这里我的环境是ubuntu中的miniconda下的tf,我的用户名是username。

  1. LookupError:
  2. **********************************************************************
  3. Resource wordnet not found.
  4. Please use the NLTK Downloader to obtain the resource:
  5. >>> import nltk
  6. >>> nltk.download('wordnet')
  7. For more information see: https://www.nltk.org/data.html
  8. Attempted to load corpora/wordnet
  9. Searched in:
  10. - '/home/username/nltk_data'
  11. - '/home/username/miniconda3/envs/tf/nltk_data'
  12. - '/home/username/miniconda3/envs/tf/share/nltk_data'
  13. - '/home/username/miniconda3/envs/tf/lib/nltk_data'
  14. - '/usr/share/nltk_data'
  15. - '/usr/local/share/nltk_data'
  16. - '/usr/lib/nltk_data'
  17. - '/usr/local/lib/nltk_data'
  18. **********************************************************************

缺失omw-1.4。这里我的环境是ubuntu中的miniconda下的tf,我的用户名是username。

  1. LookupError:
  2. **********************************************************************
  3. Resource omw-1.4 not found.
  4. Please use the NLTK Downloader to obtain the resource:
  5. >>> import nltk
  6. >>> nltk.download('omw-1.4')
  7. For more information see: https://www.nltk.org/data.html
  8. Attempted to load corpora/omw-1.4
  9. Searched in:
  10. - '/home/username/nltk_data'
  11. - '/home/username/miniconda3/envs/tf/nltk_data'
  12. - '/home/username/miniconda3/envs/tf/share/nltk_data'
  13. - '/home/username/miniconda3/envs/tf/lib/nltk_data'
  14. - '/usr/share/nltk_data'
  15. - '/usr/local/share/nltk_data'
  16. - '/usr/lib/nltk_data'
  17. - '/usr/local/lib/nltk_data'
  18. **********************************************************************

2.3 解决方法

在相应的环境下(这里我的环境是tf)创建nltk_data文件夹,并在下面创建corpora文件夹,再将wordnet和omw-1.4文件夹放入。最终路径为(我选择了搜索路径中的第二条路径,实际可以结合自身情况修改)

/home/username/miniconda/envs/tf/nltk_data/corpora/wordnet
/home/username/miniconda/envs/tf/nltk_data/corpora/omw-1.4

3. stopwords相关

3.1 报错代码

  1. from nltk.corpus import stopwords
  2. stop_words = set(stopwords.words('english'))

3.2 报错信息

缺失stopwords。这里我的环境是ubuntu中的miniconda下的tf,我的用户名是username。

  1. LookupError:
  2. **********************************************************************
  3. Resource stopwords not found.
  4. Please use the NLTK Downloader to obtain the resource:
  5. >>> import nltk
  6. >>> nltk.download('stopwords')
  7. For more information see: https://www.nltk.org/data.html
  8. Attempted to load corpora/stopwords
  9. Searched in:
  10. - '/home/username/nltk_data'
  11. - '/home/username/miniconda3/envs/tf/nltk_data'
  12. - '/home/username/miniconda3/envs/tf/share/nltk_data'
  13. - '/home/username/miniconda3/envs/tf/lib/nltk_data'
  14. - '/usr/share/nltk_data'
  15. - '/usr/local/share/nltk_data'
  16. - '/usr/lib/nltk_data'
  17. - '/usr/local/lib/nltk_data'
  18. **********************************************************************

3.3 解决方法

在相应的环境下(这里我的环境是tf)创建nltk_data文件夹,并在下面创建corpora文件夹,再将stopwords文件夹放入。最终路径为(我选择了搜索路径中的第二条路径,实际可以结合自身情况修改)

/home/username/miniconda/envs/tf/nltk_data/corpora/stopwords

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/码创造者/article/detail/803359
推荐阅读
相关标签
  

闽ICP备14008679号