赞
踩
指代是自然语言中的一种重要的表达方式,它使得语言表达简洁连贯,然而在篇章中大量使用指代,增加了计算机对篇章理解的难度.指代消解的主要任务是识别篇章中对现实世界同一实体不同的表达的过程.从计算语言学的角度,指代消解可以看成是一个分类或者一个聚类的过程.分类的过程主要是判断实体表达之间是否指向同一个实体,聚类的过程主要是判断一个实体表达能否加入到指向某个实体的集合中.从数学的角度上来说,指代消解等同于判断一对实体表达对之间是否满足自反性、对称性、传递性。
句子中如果存在指代关系,抽象的语言单元称为照应语,而具体的实体被称为先行语。
注意:先行语可以在照应语的前面,也可以在后面,如果在前面,照应语与先行语之间的对应关系称为照应关系,简称照应(anaphora);如果在后面,则称为逆照应(cataphora)。
指代消解就是寻找篇章中先行语与照应语之间的关系,并明确给出照应语所指向的先行语的过程。
指代消解根据不同的角度可以分为不同的类型,根据语言学知识从照应语的角度把指代消解分为如下三类:
在篇章中当照应语的位置在先行语之前则称为预指消解.当照应语位于先行语之后称为回指消解。
根据指代的表现形式的抽象程度,指代消解分为名词消解、代词消解、零代词消解。当句子中的照应语为普通名词时,此时的指代消解叫做普通名词消解。
当先行语和照应语存在等价关系,并同时指向同一个实体时叫做共指.共指关系在脱离上下文的语义仍旧独立存在,与上下文关系较弱。
非等价消解是指先行语与照应语之间存在着非对称的关系并且和上下文的语义有着紧密联系,在不同的语义和语境下照应语指代的先行语不同。
美国政府支持的一个致力于真实文本理解的例会。MUC中指代关系的标注引入了2个标注对,采用SGML标注方法:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。