赞
踩
朴素贝叶斯法(Naive Bayes model)是基于贝叶斯定理与特征条件独立假设的分类方法。
P
(
A
∣
B
)
=
P
(
B
∣
A
)
∗
P
(
A
)
P
(
B
)
P(A|B)=\frac{P(B|A) * P(A)}{P(B)}
P(A∣B)=P(B)P(B∣A)∗P(A)
其中A
表示分类,B
表示属性,因此此公式更通俗的表述如下:
P
(
分类
∣
属性
)
=
P
(
属性
∣
分类
)
∗
P
(
分类
)
P
(
属性
)
P(分类|属性)=\frac{P(属性|分类) * P(分类)}{P(属性)}
P(分类∣属性)=P(属性)P(属性∣分类)∗P(分类)
即在已知属性B
的前提下,分类为A
的概率等于似然率(已知分类中属性B
的概率)乘以先验概率(分类A
的概率)除以证据概率(属性B
的概率)。
举例:在夏季,某公园男性穿凉鞋的概率为 1/2 ,女性穿凉鞋的概率为 2/3 ,
并且该公园中男女比例通常为 2:1 ,问题:若你在公园中随机遇到一个穿凉鞋的人,
请问他的性别为男性或女性的概率分别为多少?
P(男|穿凉鞋)=P(穿凉鞋|男)P(男)/P(穿凉鞋)
= 1/2 * 2/3 / (2/3 * 1/2 + 1/3 2/3)
= 1/3 / (1/3+2/9)
= 3/5
P(女|穿凉鞋)=P(穿凉鞋|女)P(女)/P(穿凉鞋)
= 2/3 * 1/3 / (2/3 * 1/2 + 1/3 2/3)
= 2/9 / (1/3+2/9)
= 2/9 * 9/5
= 2/5
所以在公园里,随机遇到一个穿凉鞋的人,性别为女男的概率是 3/5,性别为女的概率为 2/5。
使用拉普拉斯修正,修改公式如下:
P
^
(
C
=
c
j
)
=
N
(
c
j
)
+
1
N
+
C
\hat{P}(C=c_j)=\frac{N(c_j)+1}{N+C}
P^(C=cj)=N+CN(cj)+1
上式表示
c
j
c_j
cj分类的概率,其中 C 表示分类数量,N 表示所有的数量。
P
^
(
x
i
∣
C
=
c
j
)
=
N
(
x
i
∣
C
=
c
j
)
+
1
N
+
X
\hat{P}(x_i|C=c_j)=\frac{N(x_i|C=c_j)+1}{N+X}
P^(xi∣C=cj)=N+XN(xi∣C=cj)+1
上式表示特定
x
i
x_i
xi属性中类
c
j
c_j
cj的概率,其中 X 表示属性数量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。