赞
踩
近日,清华大学NLP组总结了最近30年来机器翻译领域最重要的论文和学术文献目录,并在Github上公开放出。
此列表首先给出了30年来机器翻译领域必读的10篇最重要的论文,接下来的内容分为统计机器翻译和神经机器翻译两大部分。由于近年来取得重大突破几乎全在神经机器翻译领域,这份论文目录更为侧重神经机器翻译部分。
每篇论文资源均按作者、题目、发表年份、发表会议/期刊的顺序给出。
新智元在此将清单全文转录如下,由于原文较长,限于微信文章篇幅限制,分为两篇。
在此感谢此资源的主要维护者,Github id:minicheshire、thudcsly和其他几位的贡献者的辛勤劳动。
资源地址:
https://github.com/THUNLP-MT/MT-Reading-List
机器翻译必读10篇论文
统计机器翻译
教程
词模型
短语模型(Phrase-based Models)
语句模型(Syntax-based Models)
判别训练(Discriminative Training)
系统组合
评估
神经机器翻译
教程
模型架构
注意力机制(Attention Mechanism)
基于开放词汇和字符的神经机器翻译
训练目标与框架
解码
资源稀缺语言的翻译
半监督方法
无监督方法
基于Pivot的方法
数据增强方法
数据选择方法
迁移学习和多任务学习方法
元学习方法
多语言翻译
句法/语义约束
覆盖范围约束
文档级翻译
翻译鲁棒性
翻译可视化与可解释性
翻译公平性与多样性
翻译效率
预训练
语音翻译与同声翻译
领域适应
翻译质量评估
自动化译后编辑
词汇翻译与双语词汇归纳
诗歌翻译
Github链接:
https://github.com/THUNLP-MT/MT-Reading-List
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。