赞
踩
在文本中,找到表示相同真实世界中实体的指代。如下图:Barack Obama 和 his 和 He 都表示 Obama
mention:可以理解为文档中的实体的不同指代(表述),它可以是代词、也可以是命名实体、还可以是名词短语,其实也可以理解成文档中所有实体,为了和entity加以区别。
antecedent:可理解为前指,前指表示的是具体的实体,图1中 “Sally” 和 “she ” 具有共指关系,它们都表示“Sally”这个人。“Sally” 是具体化的实体,“she"是抽象化实体,即“Sally” 是“she”的前指,图二中"Barack Obama” 和 "he"也是如此。
coreferent :共指关系,图中 “Sally” 和 “she ” 具有共指关系,它们都表示“Sally”这个人。
cluster :可理解为簇,就类似聚类中的簇,聚类是将同一类事务聚到一起,共指消解就是将文本中具有共指关系的mention 聚到一起。图中 “Sally” 和 “she ” 为一个簇, “John” 和 “him” 为一个簇, “violin”为一个簇。
anapnoric :可以理解为回指,回指表示的是抽象化的实体,图1中“Sally” 是具体化的实体,“she"是抽象化实体,即“she” 是“Sally”的回指,图二中"Barack Obama” 和 "he"也是如此。
non-anapnoric:可以理解为没有回指;即图中"violin"只有具体化的实体(它本身),没有抽象化的实体。
补充:span:一个句子中的短语或者子串【英文解释:a span is just a contiguous sequence of words 】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。