赞
踩
语言模型中经常使用困惑度来作为语言模型的评价
对于一段 句子(sentence) s 由词构成,即: s=w1w2⋅⋅⋅wns=w1w2⋅⋅⋅wn ,w代表词
PPL(S)=P(w1w2⋅⋅⋅wN)−1/NPPL(S)=P(w1w2⋅⋅⋅wN)−1/N
对两边都取 对数 则:
logPPL(S)=−logP(w1w2⋅⋅⋅wN)N=−∑i=1NlogP(w1w2⋅⋅⋅wi−1)NlogPPL(S)=−logP(w1w2⋅⋅⋅wN)N=−∑i=1NlogP(w1w2⋅⋅⋅wi−1)N
所以:一般的困惑度越小,模型越好,应该尽可能找困惑度小的模型