赞
踩
一个句子是否合理,就看他的可能性大小如何。 概括来说:假定S表示某一个有意义的句子,由一连串特定顺序排列的词w1,w2,...,wnw1,w2,...,wn组成,这里的n表示句子的长度。则概率P(S)表示上面句子的合理性。
高阶语言模型:假定文本中的没个词wiwi和前面的N-1个词有关,而与更前面的词无关,这样当前词wiwi的概率只取决于前面N-1个词P(wi−N+1,wi−N+2,...,wi−1)P(wi−N+1,wi−N+2,...,wi−1),因此:
对于上面介绍的模型,比如说二元模型,假设样本中N(wi,wi−1)N(wi,wi−1)出现的词数为0,这样的话能否说明P(wi|wi−1)P(wi|wi−1)概率为0。答案是否定的。对于未出现的事件,我们怎么处理??1953年古德和图灵给出了一个概率计算公式。