赞
踩
什么是语言学、什么是语音学?
自然语言理解、自然语言处理、计算语言学,以及中文信息处理,它们又有什么关系?
在本节中,将对自然语言处理相关的概念进行解释与辨析。
是针对中文的自然语言处理技术。
至此,我们可以回答本节开头提到的问题:“自然语言理解、自然语言处理、计算语言学,以及中文信息处理,它们又有什么关系?”
对于中文信息处理和自然语言处理的关系:中文信息处理是专门针对中文的语言信息技术研究,是自然语言处理学科下的一个分支。
对于自然语言处理(NLP)、计算语言学(CL)、自然语言理解(NLU)三者的关系,它们相互交叉又有所不同,可以统称为人类语言技术(Human Language Technology,HLT),如下图所示。有些资料中甚至将三者互相划上了等号。
其发展历程:
按照应用目标来划分,NLP广义上包括:
由于我们将语音识别、合成和说话人识别等以语音为研究对象的技术独立出来,称为语音技术,其他以文本为处理对象的研究内容作为自然语言处理的主体。
各个研究方向之间的关系如下:
形态学问题:研究词由有意义的基本单位-词素的构成问题,即分词问题(词的长度问题)的研究
语法学问题:研究句子结构成分之间的相互关系和组成句子序列的规则,即语法。试图建立快速有效的句子结构分析方法。
语义学问题:研究如何从一个语句中的词的意义,以及这些词在该语句中句法结构中的作用来推导出该句的意义。
语用学问题:研究在不同上下文中语句的应用,以及上下文对语句理解所产生的的影响。
狭义上看,语用学处理的是语言结构中有形式体现的那些语境;
广义上看,语用学处理的是研究语义学未能涵盖的那些意义。.
语音学问题:研究语音特性、语音描述、分类及转写方法啊等
由于机器翻译中映射单元的不对等性:词法表达不相同、句法结构不一致、语义概念不对等,机器翻译需要从大量复杂多样的不确定性中寻找确定性结论
人脑理解语言,是一个复杂的思维过程,设计到常识与背景知识、语言学、心理学、逻辑学、认知科学等等各个领域
——理性主义与经验主义的合谋
其中理性主义方法是基于规则的方法,采用知识库+推理系统的模式,依赖于符号处理系统
其中经验主义方法是基于统计的方法,采用语料库+统计模型的模式
目前现行的研究方法是进行“理性主义与经验主义的合谋”,使用符号智能+计算智能,建立融合方法
(1)部分问题得到了解决,可以为人们提供辅助性的帮助
(2)基础问题研究仍任重而道远
(3)社会需求日益迫切
(4)许多技术离真正实用的目标还有相当的距离,尚未建立起有效、完善的理论体系。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。