当前位置:   article > 正文

Py之nltk:NLTK的简介、安装、使用方法之详细攻略_nltk最新版本

nltk最新版本

Py之nltk:NLTK的简介、安装、使用方法之详细攻略

目录

NLTK的简介

1、词性标注

NLTK的安装

NLTK的使用方法

1、基础用法

2、进阶用法

NLP之nltk:基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现


NLTK的简介

       NLTK是构建用于处理人类语言数据的Python程序的领先平台。它为超过50个语料库和词汇资源(如WordNet)提供了易于使用的界面,以及一套用于分类、标记化技术、词干、标记、解析和语义推理的文本处理库、工业级NLP库的包装器以及一个活跃的讨论论坛。

       用Python进行自然语言处理为语言处理的编程提供了一个实用的介绍。它由NLTK的创建者编写,指导读者完成编写python程序、使用语料库、对文本进行分类、分析语言结构等的基础知识。这本书的在线版本已经为python 3和nltk 3进行了更新。

      NLTK(Natural Language ToolKit),是时下非常流行的在Python解释器环境中用于自然语言处理的工具包。对于NLTK的使用者而言,它就像是一名极其高效的语言学家,为您快速完成对自然语言文本的深层处理和分析。

官网NLTK :: Natural Language Toolkit

参考地址自然语言处理工具包之NLTK – 标点符 - 广告流程自动化

1、词性标注

对句子进行词性标注需要先进行切分。默认使用的标记格式是penn treebank 库使用的

地址Penn Treebank P.O.S. Tags

NLTK的安装

  1. pip install nltk
  2. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple nltk
  3. pip install --upgrade nltk
  4. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade nltk

NLTK的使用方法

1、基础用法

  1. from nltk.corpus import treebank
  2. t = treebank.parsed_sents('wsj_0001.mrg')[0]
  3. t.draw()

_images/tree.gif

2、进阶用法

  1. import nltk
  2. sentence = """At eight o'clock on Thursday morning
  3. tokens = nltk.word_tokenize(sentence)
  4. print(tokens)
  5. tagged = nltk.pos_tag(tokens)
  6. print(tagged )

NLP之nltk:基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现

NLP之nltk:基于nltk库实现句子分词及标注对应词性、句子分割、波特词干算法进行词干提取代码案例实现_nltk句子分割_一个处女座的程序猿的博客-CSDN博客

相关文章
NLP之BoW&NLTK:自然语言处理中常用的技术——词袋法Bow、NLTK库

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/455488
推荐阅读
相关标签
  

闽ICP备14008679号