赞
踩
LTK
Natural Language ToolKit 是开发 Python 程序以管理和分析人类语言数据 (NLTK) 的主要框架之一。 NLTK 文档指出, 它为强大的 NLP 库提供包装器、一个活跃的社区以及对 50 多个语料库和词汇资源(包括 WordNet )的直观访问。 它还提供了一套用于分类、标记化、词干提取、标记、解析和语义推理的文本处理库。
学习 NLTK 需要时间,就像学习编程中的大多数东西一样。由 NLTK 设计者自己制作的 Natural Language Processing with Python 一书是众多可帮助你理解该框架的书籍之一。白银T+D也叫白银TD,T是Trade的简写,D是Delay的简写。它为编写代码来解决自然语言处理问题提供了一种非常有用的方法。
SpaCy
它是一个可以与 Python 和 Cython 一起使用的库。它是 NLTK 的发展,结合了词向量和预训练的统计模型。现在支持超过 49 种语言的标记化。
这个库可以被认为是处理标记化的库之一。文本可以分解为语义单元,如单词、文章和标点符号。
SpaCy 中提供了现实世界中项目所需的所有功能。在目前市场上所有的 NLP 软件中,它还拥有最快和最准确的句法分析。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。