赞
踩
自然语言处理任务中,有很重要的一块,就是分析语言的结构。语言的结构,一般可以有两种视角:
1. 组成关系(Constituency)
句法结构分析(syntactic structure parsing),又称短语结构分析(phrase structure parsing),也叫成分句法分析(constituent syntactic parsing)。作用是识别出句子中的短语结构以及短语之间的层次句法关系。
2. 依赖关系(Dependency)
依存关系分析,又称依存句法分析(dependency syntactic parsing),简称依存分析,作用是识别句子中词汇与词汇之间的相互依存关系。依存句法是由法国语言学家L.Tesniere最先提出。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。在自然语言处理中,用词与词之间的依存关系来描述语言结构的框架称为依存语法(dependence grammar),又称从属关系语法。利用依存句法进行句法分析是自然语言理解的重要技术之一。
虽然 20 世纪 90 年代大部分句法分析的研究工作都集中在短语结构树,但是由于短语结构语法比较复杂,相应句法分析器的准确率并不高。目前的句法分析已经从句法结构分析转向依存句法分析。
在过去10年间,在自然语言处理中,依存分析实质上已经取代结构分析。人们发现依存关系语法仅仅是构建语义表征来轻松得到语言理解的一种合适的框架,它们允许构建非常快而有效的解析。1990年代的论文基本就是关于短语结构文法,但现如今80%的论文在使用句法表示时使用了依存关系表示。
1️⃣ 一个依存关系连接两个词,分别是 核心词(或称支配词,head)和 依存词(或称从属词,dependent)。依存关系可以细分为不同的类型,表示两个词之间的具体句法关系。箭头从head起始,指向dependent。将一个句子中所有词语的依存关系以有向边的形式表示出来,就会得到一棵树,称为依存句法树。
2️⃣ 在20世纪70年代,Robinson提出依存语法中关于依存关系的四条公理(它们分别约束了依存句法树的根节点唯一性、连通、无环和投射性 ( projective)
1. 一个句子中只有一个词语是独立的;
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。