赞
踩
统计语言模型实际上是一个概率模型,所以常见的概率模型都可以用于求解这些参数
常见的概率模型有:N-gram 模型、决策树、最大熵模型、隐马尔可夫模型、条件随机场、神经网络等
目前常用于语言模型的是 N-gram 模型和神经网络语言模型
朴素贝叶斯中使用的独立性假设为
P
(
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
)
=
P
(
x
1
)
P
(
x
2
)
P
(
x
3
)
.
.
.
P
(
x
n
)
(1)
P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2)P(x_3)...P(x_n) \tag{1}
P(x1,x2,x3,...,xn)=P(x1)P(x2)P(x3)...P(xn)(1)
去掉独立性假设,有下面这个恒等式,即联合概率链规则
P
(
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
)
=
P
(
x
1
)
P
(
x
2
∣
x
1
)
P
(
x
3
∣
x
1
,
x
2
)
.
.
.
P
(
x
n
∣
x
1
,
x
2
,
.
.
.
,
x
n
−
1
)
(2)
P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_1,x_2)...P(x_n|x_1,x_2,...,x_{n-1}) \tag{2}
P(x1,x2,x3,...,xn)=P(x1)P(x2∣x1)P(x3∣x1,x2)...P(xn∣x1,x2,...,xn−1)(2)
其中,
x
i
x_i
xi代表一个词,联合概率链规则表示句子中每个词都跟前面一个词有关,而独立性假设则是忽略了一个句子中词与词之间的前后关系。
例如:S = 我爱北京天安门,那么此时我们希望知道这句话合理的可能性有多少? 就需要计算
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。