当前位置:   article > 正文

Python机器学习及NLP库_常用nlp python库

常用nlp python库

机器学习方面:

Scikit-Learn 可用于分类、特征选择、特征提取和聚集。还拥有自然语言处理特征提取的能力、词袋、tf-idf算法、预处理等。

Matplotlib 可以用于快速可视化。

Statsmodels 主要用于预测性和探索性分析。可以拟合线性模型,进行统计分析或预测性建模。

PyMC 做贝叶斯曲线的工具。

Shogun 主要用于支持向量机(SVM)

Gensim 用于主题建模,LDA及其变体等方面,支持自然语言处理

Orange 拥有图形界面的的库,能力比较平均。


NLP(自然语言处理)方面:

NLTK 《Python自然语言处理》一书的默认工具,提供WordNet这种方便处理词汇资源的接口,可用在分类、分词、词干提取、标注等任务。

Jieba 可用于分词、词性标注、特征词提取等方面。

Gensim 用于对大型语料库进行主题建模、文件索引、相似度检索等。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/551152
推荐阅读
相关标签
  

闽ICP备14008679号