当前位置:   article > 正文

NLP 评价标准 - BLEU_中文bleu的缺点

中文bleu的缺点
BLEU

论文:https://aclweb.org/anthology/P02-1040.pdf
思想:数词是否在ground truth里

举例

原文:猫坐在垫子上
机器翻译:The cat sat on the mat
人工翻译:The cat is on the mat

1-gram

可以看到机器翻译6个词,有5个词命中参考译文,那么它的匹配度为 5/6.

2-gram

2元词组的匹配度则是 3/5。

3-gram

3元词组的匹配度则是 1/4。

4-gram

4元词组的匹配情况就没有了。

存在的缺点

句子过短的情况
例:
机器译文:The cat
参考译文:The cat is on the mat.

解决方法
增加惩罚项系数

其中r为参考翻译的长度,c为机器翻译的长度。

BLEU总公
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/936801
推荐阅读
相关标签
  

闽ICP备14008679号