赞
踩
句法分析是自然语言处理技术中的关键技术之一,其基本任务是确定句子的句法结构或句子中词汇之间的依存关系。
句法分析分为句法结构分析和依存关系分析。
句法结构分析又称成分结构分析或短语结构分析,其又分为二种。以获取整个句子的句法结构为目的分析称为完全句法分析或完全短语结构分析。以获得局部成分(如基本名词短语)为目的的分析称为局部分析或浅层分析。
依存关系分析又称为依存句法分析或依存结构分析。
句法分析是指对输入的单词序列判断其构成是否合乎给定的语法,分析出合乎语法的兔子的句法结构。句法结构一般用树状数据结构表示,通常称为句法分析树。
句法结构分析一般有三个任务:1,判断输入的字符串是否属于某种语言;2,消除句子中的词法和结构方面的歧义;3,分析句子内部结构,如成分构成,上下文关系。
句法分析一般需要考虑三个方面的工作:语法的形式化表示,词条信息的描述,分析算法的设计。其中语法的形式化表示着重了解上下文无关方法。
句法分析方法可以简单分析基于规则和基于统计的。
句法分析树的形成方法可以分为三类:自顶向下,自底向上,二者结合。
主要是了解基于概率的上下文无关文法分析。
浅层句法分析的定位。完全句法分析要求通过一系列的分析过程,最终得到句子的完整句法分析树,而浅层句法分析只要求识别句子中某些结构相对简单的独立成分。例如:非递归的名词短语和动词短语。这些短语称为语块。
浅层句法分析有二个主要任务:1,语块边界分析;2,语块之间的关系分析。前者为主要任务.
这块重点是了解基于SVM/CRF的基本名词性短语分析.
这块主要是了解些句法依存分析的基本概念.
用词与词之间的关系来描述语言结构的框架称为依存语法,又称从属关系语法.
在依存语法理论中,"依存"是词与词之间支配与被支配的关系,这种关系不是对等的,而是有方向的.处于支配的称为支配者,被支配的称从属者.
依存句法分析结构图常用的有三种:有向图,依存树,依存投射树.
依存句法并没有对依存关系进行分类,但在实际应用中,一般会给树的结点和边添加信息:边的信息有句法功能,语言角色;边的信息有词本身,词条,词性标注,形态特点等.
计算语言学家J.Robinson提出了依存语法的四条公理:1,一个句子只有一个独立的成分;2,句子的其他成分都从属于某一成分;任何一个成分都不能依赖于二个或二个以上的成分;4,如果A直接从属于B,C位于A/B之间,则C从属A或B或AB之间的某一成分.
我国学者冯志伟提出了依存结构树就满足5个条件:1,单纯结点条件,只有终结点,没有非终结点;2,单一父结点条件,除根结点外,其他结点都有父结点;3,独根结点条件,一个依存树只能有一个根结点;4,非交条件,依存树的树枝不能彼此相交;5,互斥条件,从上到下的支配关系和从左到右的前于关系是相互排斥的,二个结点间存在支配关系,就不能存在前于关系。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。