当前位置:   article > 正文

文本生成相关的评测指标_ppl 评测

ppl 评测

一、文本生成相关任务

  • 翻译
  • 对话生成
  • 自动文摘
  • image2caption

二、文本生成评测指标

  • BLEU
  • Rouge : https://www.jianshu.com/p/0afb93fda403
  • NIST
  • METEOR
  • TER

2.1 BLUE

2.2 Rouge

2.3 PPL困惑度

ppl是用在自然语言处理领域(NLP)中,衡量语言模型好坏的指标。它主要是根据每个词来估计一句话出现的概率,并用句子长度作normalize,公式为:
在这里插入图片描述

https://blog.csdn.net/shawroad88/article/details/105639148

reference

https://zhuanlan.zhihu.com/p/150057895

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/599007
推荐阅读
相关标签
  

闽ICP备14008679号