赞
踩
语言分析: 分析语言表达的结构和含义
词法分析: 形态还原、词性标注、命名实体(人名、地名、机构名)识别、分词(汉语、日语等)等
句法分析: 组块分析、结构分析、依存分析
语义分析: 词义、句义(逻辑、格关系、…)、篇章(上下文)(指代、实体关系、…)
语言生成: 从某种内部表示生成语言表达
多语言处理(机器翻译、跨语言检索): 语言之间的对应、转换
不同的应用对上述任务有不同的要求。
基于规则的理性方法(Rationalist approach)
基于语料库的经验方法(Empiricist approach)
混合方法
- 理性方法的优、缺点
1.相应的语言学理论基础好
2.语言知识描述精确
3.处理效率高
4.知识获取困难(高级劳动)
5.系统鲁棒性差:不完备的规则系统将导致推理的失败
6.知识扩充困难,很难保证规则之间的一致性
- 经验方法的优、缺点
1.知识获取容易(低级劳动)
2.系统鲁棒性好:概率大的作为结果
3.知识扩充容易、一致性容易维护
4.相应的语言学理论基础差
5.缺乏对语言学知识的深入描述和利用,过于机械
6.处理效率低
- 利用各家之长,相互融合?
分析型语言
黏着型语言
屈折型语言
另外,还可以按SVO型(主-动-宾)、VSO型(动-主-宾)和SOV 型(主-宾-动) 分类
歧义处理
语言知识的表示、获取和运用
成语和惯用型的处理
对语言的灵活性和动态性的处理
上下文和常识知识(与语言无关)的利用和处理
缺乏计算语言学的句法/语义理论,大都借用基于西方语言的句法/语义理论
词法分析
句法分析
主动词识别难(特别对于流水句)
词法分类与句法功能对应差(例如:他喜欢走)
语义分析
句法结构与句义对应差(例如:老头晒太阳)
时体态确定难 (汉语无形态变化)
资源(语料库)缺乏
语言学:各种语法、语义理论
计算机科学(包括人工智能、机器学习)
数学:逻辑、概率与统计、信息论等
哲学(认知学)
心理学
…
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。