当前位置:   article > 正文

[nlp] scikit-learn 朴素贝叶斯类库概述——GaussianNB,MultinomialNB,BernoulliNB_bernoullinb, gaussiannb和 multinomialnb

bernoullinb, gaussiannb和 multinomialnb

参考:https://www.cnblogs.com/pinard/p/6074222.html

1.scikit-learn 朴素贝叶斯类库概述

scikit-learn中,一共有3个朴素贝叶斯的分类算法类。分别是GaussianNB,MultinomialNB和BernoulliNB。其中GaussianNB就是先验为高斯分布的朴素贝叶斯,MultinomialNB就是先验为多项式分布的朴素贝叶斯,而BernoulliNB就是先验为伯努利分布的朴素贝叶斯。

这三个类适用的分类场景各不相同,
一般来说,如果样本特征的分布大部分是连续值,使用GaussianNB会比较好。
如果如果样本特征的分大部分是多元离散值,使用MultinomialNB比较合适。
如果样本特征是二元离散值或者很稀疏的多元离散值,应该使用BernoulliNB

2. GaussianNB类使用总结

GaussianNB假设特征的先验概率为正态分布,即如下式:
在这里插入图片描述
  在使用GaussianNB的fit方法拟合数据后,我们可以进行预测。此时预测有三种方法,包括predict,predict_log_proba和predict_proba。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/677130
推荐阅读
相关标签
  

闽ICP备14008679号