赞
踩
Bleu 全称为 bilingual evaluation understudy ,意为双语评估替换,是衡量一个有多个正确输出结果的模型的精确度的评估指标。
下面拿中英机器翻译做例子:
中文:垫上有一只老鼠。
参考翻译1:The cat is on the mat.
参考翻译1:There is a cat on the mat.
MT:the cat the cat on the mat.
bleu的得分有一元组,二元组,三元组等等,这里只做到三元组。
下面先计算一元组得分,即先把MT输出的句子拆分成the,cat,on,mat,频数分别为3,2,1,1:
MT中的unigrams | Count | Count(参考翻译1) | Count(参考翻译2) | Count(clip)截取计数 |
the | 3 | 2 | 1 | 2 |
cat | 2 | 1 | 1 | 1 |
on | 1 | 1 | 1 | 1 |
mat | 1 | 1 | 1 | 1 |
上面的Count(clip) 叫截取计数,是取每个单词在所有参考翻译句子中,出现最多的次数,the在参考翻译1中出现2次&#x
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。