赞
踩
作者:禅与计算机程序设计艺术
最近,随着深度学习在图像、语言处理等领域的火爆应用,基于神经网络的语言模型迅速成为生成式对话系统中的一个重要模块。在许多任务中,生成式模型可以自动产生和完善多轮对话的自然语言文本。本文将从生成式对话模型的设计、训练、应用、评价及其改进四个方面介绍基于神经网络的语言生成模型——SeqGAN。
生成式对话模型是一个基于神经网络的机器翻译模型,它通过对话历史数据和相关知识库进行建模,能够生成新闻、日常对话、短信、邮件等具有新意的自然语言文本。最常用的两种类型:基于指针网络的生成式模型(Pointer Network)和基于序列到序列的模型(Seq2Seq)。基于指针网络的模型不断寻找合适的生成位置,使得模型能够生成连贯、符合语法、语义的句子。而基于序列到序列的模型则是将输入序列转换成输出序列,该模型能够生成任意长度、复杂程度任意的文本。但两者存在不同之处,例如基于指针网络的模型能够生成较好的抽象意识,能够理解情感倾向,而基于序列到序列的模型则更擅长生成规律性的文本,如新闻文章、维基百科、邮件。
SeqGAN 是一种基于Seq2Seq模型的生成式对话模型,由两部分组成:生成器和判别器。生成器负责根据历史对话、上下文和知识库生成候选回复;判别器负责判断生成样本的真实程度,并调整生成器的参数以提高生成质量。SeqGAN将序列到序列模型和GAN结合起来,既能生成连贯、精准的回复,也能实现图片描述、文本摘要、风格迁移等功能。本文主要围绕SeqGAN展开讨论。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。