赞
踩
学习教材《统计学习方法(第二版)》李航
学习内容:第4章 朴素贝叶斯法
朴素贝叶斯(naive bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯法包括朴素贝叶斯的学习与分类、朴素贝叶斯法的参数估计算法。
设输入空间为n维向量的集合,输出空间为类标记集合。输入特征向量,输出为类标记。X是定义在输入空间上的随机向量,Y是定义在输出空间上的随机变量。是X和Y的联合概率分布。训练数据集
由独立同分布产生。
朴素贝叶斯法通过训练数据集学习联合概率分布。具体的,学习一下先验概率分布及条件概率分布。先验概率分布
条件概率分布:
于是学习到联合概率分布。
贝叶斯基本的原理为:
其中:
是A的先验概率或边缘概率,就是在不考虑B的情况下A的概率;
是一致B发生后A的条件概率,所以叫做A的后验概率;
参考网址:贝叶斯公式_百度百科
朴素贝叶斯法对条件概率分布做了条件独立性的假设。由于这是一个较强的假设,所以交朴素贝叶斯(区别于一般的贝叶斯方法)。具体的条件独立性假设是:
朴素贝叶斯分类时,对给定的输入x,通过学习到的模型计算后验概率分布,将后验概率最大的类别作为x的输出。后验概率计算根据贝叶斯定理进行:
根据条件独立的假设有:
这是朴素贝叶斯法分类的基本公式。于是朴素贝叶斯分类器可表示为:
注意到,上式中分母对所有的都是相同的,所以,
朴素贝叶斯法将市里分到后验概率最大的类中。这等价与期望风险最小化。假设选择0-1损失函数:
式中是分类决策函数。这时,期望风险函数为
期望是对联合分布取的
为了使期望风险最小化,只需对X=x逐个极小化,由此得到:
这样一来,根据期望风险最小化准则就得到了 后验概率最大化准则:
以上是说明为什么将后验概率最大的类作为的类输出。
在朴素贝叶斯法中,学习意味着估计和。可以应用 极大似然估计法估计相应的概率。先验概率的极大似然估计是:
先验概率就是先在给定的训练集中,计算每个分类占总样本数的比例
第j个特征可能的取值集合为,条件概率的极大似然估计是:
此处的理解条件概率为,在所有的的样本中,的数量 。
算法4.1 (朴素贝叶斯算法)
上面的过程结合着下面例题的程序看更好理解。
例4.1 试由表4.1的训练数据学习一个朴素贝叶斯分类器,并确定的类标记。表中为特征,取值的 集合分别为,, 为类标记,。
解:根据算法4.1,容易计算下列概率:
先验概率:
条件概率
.
对于给定的计算:
取计算结果最大的分类,所以的分类为-1。
#
用极大似然估计可能会出现要顾及的概率值为0的情况,这时会影响到后验概率的计算结果。采用平滑的方式进行计算:
式中。等价于在随机变量各个区直的频数上赋予一个正数。当时,就是极大似然函数估计。常取,这时称为拉普拉斯平滑。
此时先验概率的贝叶斯估计是:
例4.2 问题同4.1,按照拉普拉斯平滑估计概率,即取。
第一步:极大似然估计的一般步骤
1.写出随机变量的概率分布函数;
2.写出似然函数;
3.对似然函数去对数,得到对数似然函数,并进行化简;
4.对参数进行求导,并令导数等于0;
5.求解似然函数方程,得到参数的值。
第二步:证明公式4.8
根据朴素贝叶斯定义可以,满足独立同分布,假设概率为p,其中在随机变量中出出现的次数,可得似然函数为:
对似然函数取对数,得到对数似然函数为:
使似然函数的导数等于0.
可得,
综上所述:公式4.8得证。#
第三步:证明公式4.9
根据朴素贝叶斯法对条件概率分布独立性的假设可得:
根据上述定义,在条件下,随机变量X满足条件独立性,假设的概率为p,其中在随机变量Y中出现的次数。
和同时出现的次数。可得似然函数为:
与第2步推导过程类似,可求解得到,带入n和m的公式可得:
公式4.9得证。
解题思路:
1.贝叶斯估计的一般步骤
2.证明公式4.11:假设服从狄利克雷分布(Dirichlet),根据贝叶斯公式,推导后验概率也服从Dirichlet分布,求参数期望;
3.证明公式4.10:证明通4.11
解体步骤:
第一步:贝叶斯估计的一般步骤
1.确定参数的先验概率
2.根据样本集,计算似然函数:
3.利用贝叶斯公式,求的后验概率:
4.计算后验概率分布参数的期望,并求出贝叶斯估计值:
第二步:证明公式4.11
证明思路:
1.条件假设:,且参数服从Dirichlet分布;随机变量Y出现的次数为;
2.得到u的先验概率;
3.得到似然函数;
4.根据贝叶斯公式,计算后验概率
5.计算u的期望
证明步骤:
1.条件假设
根据朴素贝叶斯的基本方法,训练数据,假设:
(1)随机变量Y出现的次数为,即,可知
(2),随机变量服从参数为的Dirichlet分布。
2.得到先验概率
根据假设(2)和Dirichlet分布的定义,可得先验概率为
3.得到似然函数
记,可得似然函数为
4.得到后验概率分布
结合贝叶斯公式,求的后验概率分布,可得
根据假设(1)可得
上式表明,后验概率分布也服从dirichlet分布
5.得到随机变量u的期望
根据后验概率分布和假设(1),求随机变量u的期望,可得:
E(u_k)=\frac{\alpha_k}{\sum_{k=1}^K\alpha_k
其中,则:
\begin{aligned} E(u_k)&=\frac{\alpha_k}{\sum_{i=1}^K\alpha_k}\\ &=\frac{\lambda+m_k}{\sum_{i=1}^K(\lambda+m_k)}\\ &=\frac{\lambda+m_k}{\sum_{i=1}^K\lambda+\sum_{i=1}^Km_k}\\ &=\frac{\lambda+m_k}{K\lambda+N}\\ &=\frac{\lambda+\sum_{i=1}^NI(y_i=c_k)}{K\lambda+N}\\ \end{}
随机变量取的期望,可得
公式4.11得证。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。