当前位置:   article > 正文

人工智能之机器翻译_人工智能机器翻译概念

人工智能机器翻译概念

发展历程:

在这里插入图片描述

1. 直译式翻译系统(direct translation MT systems)

通过快速的分析和双语词典,将原文译出。
在这里插入图片描述

2. 规则式翻译系统(rule-based MT systems)

先分析原文内容,产生原文的句法结构,再转换成译文的句法结构,最后再生成译文。

3. 中介语式翻译系统(inter-lingual MT systems)

先生成一种中介的表达方式,而非特定语言的结构;再由中介的表达式,转换成译文。
在这里插入图片描述

4. 知识库式翻译系统(knowledge-based MT systems)

翻译经常需要除了词汇之外的各种知识,使用知识获取工具(knowledge acquisition),以充实知识库的内容。

5. 统计式翻译系统(Statistics-based MT systems )

1994年,IBM公司A.Berger等用统计方法和各种不同的对齐技术,给出了统计式机器翻译系统Candide。
统计机器翻译基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。
目前,基于统计法机器翻译系统有Google翻译、Bing翻译和百度翻译等。
统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型,并在此统计模型基础上,定义要估计的模型参数,并设计参数估计算法。
早期的基于词的统计机器翻译采用的是噪声信道模型,采用最大似然准则进行无监督训练,而近年来常用的基于短语的统计机器翻译则采用区分性训练方法,一般来说需要参考语料进行有监督训练。

6. 范例式翻译系统(example-based MT systems )

将过去的翻译结果,当成范例,产生一个范例库。

7. 翻译记忆(translation memory, TM )

基本原理:用户利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落等),给出参考译文,使用户避免重复劳动,只专注于新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的译文,变得越来越聪明。
德国塔多思(TRADOS)公司的翻译记忆软件基于UNICODE(统一字符编码),支持55种语言,覆盖了几乎所有语言版本的 Windows95/98/NT 。
混合式翻译系统(Statistics-based MT systems )同时采用多种策略,以达成翻译的目标。

8. 神经机器翻译

神经机器翻译是模拟人脑的翻译过程,目前已经远远超过统计机器翻译,成为机器翻译的主流技术。
长短期记忆神经网络(LSTM)是一种对序列数据建模的神经网络,适合处理和预测序列数据。而且,LSTM使用“累加”的形式计算状态,这种累加形式导致导数也是累加形式,避免了梯度消失,因此在神经机器翻译中得到了广泛应用。
目前,神经机器翻译领域主要研究如何提升训练效率、编解码能力以及双语对照的大规模数据集。
网络上很多神经机器翻译的开源实现,如Groundhog (https://github.com/lisa-groundhog/GroundHog)。
欢迎大家加我微信交流讨论(请备注csdn上添加)
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/345373
推荐阅读
相关标签
  

闽ICP备14008679号