赞
踩
一个句子的概率
n-gram模型又一个假定,就是当前单词出现概率仅仅与前面n-1个单词相关。
语言模型常用的评估指标为复杂度perplexity,它刻画的是通过某一语言模型估计的一句话出现的概率。比如当已经知道
考虑一个由0~9随机组成的长度为m的序列,由于这10个词出现的概率是随机的,所以每个词出现的概率都是1/10,因此在任意时刻,模型都有10个等概率的候选答案可以选择,于是perplexity的计算:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。