赞
踩
NLTK(Natural Language Toolkit)是一个用于自然语言处理和文本分析的 Python 库。
它提供了一系列易于使用的工具和接口,用于处理和分析文本数据。
NLTK 支持众多自然语言处理任务,例如文本分类、语法分析、词性标注、文本语料库处理等。
NLTK 还包含大量的语言数据和模型,可以用于训练自然语言处理模型和进行语言分析。
NLTK 的优点在于它具有丰富的文档和教程,易于上手,并且可以与其他 Python 库和工具集成使用。因此,NLTK 是自然语言处理领域中非常受欢迎的工具之一。
nltk也是众多自然语言模型的基础依赖。
pip install nltk
- (d2l) xugj@lenovo:~/d2l$ pip install nltk
- Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
- Collecting nltk
- Using cached https://pypi.tuna.tsinghua.edu.cn/packages/a6/0a/0d20d2c0f16be91b9fa32a77b76c60f9baf6eba419e5ef5deca17af9c582/nltk-3.8.1-py3-none-any.whl (1.5 MB)
- Collecting click
- Using cached https://pypi.tuna.tsinghua.edu.cn/packages/c2/f1/df59e28c642d583f7dacffb1e0965d0e00b218e0186d7858ac5233dce840/click-8.1.3-py3-none-any.whl (96 kB)
- Collecting joblib
- Using cached https://pypi.tuna.tsinghua.edu.cn/packages/91/d4/3b4c8e5a30604df4c7518c562d4bf0502f2fa29221459226e140cf846512/joblib-1.2.0-py3-none-any.whl (297 kB)
- Collecting regex>=2021.8.3
- Using cached https://pypi.tuna.tsinghua.edu.cn/packages/29/90/804db81268636547e25004404587e75a269fd6f7a38aa2d9e1209ed61544/regex-2023.3.23-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (769 kB)
- Collecting tqdm
- Using cached https://pypi.tuna.tsinghua.edu.cn/packages/e6/02/a2cff6306177ae6bc73bc0665065de51dfb3b9db7373e122e2735faf0d97/tqdm-4.65.0-py3-none-any.whl (77 kB)
- Installing collected packages: tqdm, regex, joblib, click, nltk
- Successfully installed click-8.1.3 joblib-1.2.0 nltk-3.8.1 regex-2023.3.23 tqdm-4.65.0
下载词库文件
- wget https://gitcode.net/mirrors/nltk/nltk_data/-/archive/gh-pages/nltk_data-gh-pages.zip
-
- unzip nltk_data-gh-pages.zip
查看文件检索路径
- import nltk
- nltk.data.find(".")
把词库放到搜索路径
- mkdir nltk_data
-
- nltk_data-gh-pages/packages
- cp -R nltk_data-gh-pages/packages/* ~/nltk_data
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。