生成模型的评价指标_rouge blue

作者：花生_TL007 | 2024-04-22 02:55:35

踩

rouge blue

BLEU

比较候选译文和参考译文的n-gram的重合程度，unigram用于衡量单词翻译的准确度，高阶n-gram用于衡量句子翻译的流畅度。
BLEU需要计算1-gram，2-gram的精确率
惩罚因子：不希望模型生成短句。
对重复和短句有不好的表现
在这里插入图片描述

在这里插入图片描述

将BLEU的精确率优化为召回率，查看有多少参考译句中的n元组出现在输出中。
在这里插入图片描述

ROUGE-L：将BLEU的n-gram优化为公共子序列。
在这里插入图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/466462