赞
踩
1.rouge介绍
ROUGE评价方法与pyramid,BLUE方法一起作为评价自动摘要质量的内部评价方法的三大中流砥柱。
ROUGE:recall-oriented understand for gisting evalution
2004年,Chin-Yew Lin 提出
基本思想
由多个专家分别生成人工摘要,构成标准摘要集,将系统生成的自动摘要与人工生成的标准摘要相比较,通过统计二者之间重叠的基本单元(n元语法,词序列和词对)的数目,来评价摘要的质量。通过多专家人工摘要的对比,提高评价系统的稳定性和健壮性。
这个方法已经成为评价摘要技术的通用标准之一。
2.评价标准
ROUGE-N
ROUGE-L
ROUGE-S
ROUGE-W
ROUGE-SU
3. ROUGE-N(N-gram Co-Occurrence Statistics)
N-gram模型
n-gram模型.png
句子S由词序列[图片上传失败...(image-a49417-1542860196809)]组成,计算句子S出现的概率 [图片上传失败...(image-31d2bd-1542860196809)])最简单,最直接的方法是计数后做除法,也就是最大似然估计(MLE),但是这样做会面临数据稀疏严重和参数空间巨大的问题,导致无法实用。于是一般采用n-gram模型,n-gram模型基于马尔科夫假设,他认为,一个词的出现仅仅依赖于他前面出
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。