赞
踩
目录
基于结构化数据生成描述文本,此处论文主要是应用在E2E数据集上。
如上图所示,论文任务为利用键值对数据(二元组)生成描述文本。左边的键值对包括若干个“属性-值”组成对,右边是对应数据记录的描述文本。
总结:
文本分割指的是:将描述文本进行分割,每一部分与实体数据相对应,由此即可知道每一对实体数据生成了描述数据中哪一部分。利用这种对应关系即可通过指定实体对生成相应描述文本,而无需要关注整体数据。
主要利用的是数据独立的特点,每一个实体对数据都需要生成一部分描述数据,而且生成相应描述数据时无需要关注整体数据。
文本分割是本文的核心:通过文本分割,将数据实体与文本描述段进行对应。由于数据的特点,固定的数据对描述固定的内容,由此即可利用指定实体生成指定描述内容,且生成固定描述文本时只需要关注相对于的类型实体数据,提高了准确性减少了计算开支。有多少数据对生成多少描述内容,既保证了生成的描述文本的忠实性也减少了冗余。
模型整体上,依次利用数据记录生成相应的描述文本,生成相应文本段时只关注相应的数据记录,而与其它数据记录无关。
作用:通过前面提及的描述内容,判断接下来将描述哪个记录数据
所以其实就是两个解码过程,利用每一个记录来生成一段文本,通过生成的顺序将文本连接起来。
在解码时采用三个简单限制来控制文本生成:
区别于传统的注意力模型,论文没有关注记录选择注意力,而是将记录选择从模型中单独分割了出来,即利用已生成的描述文本和上一个描述记录数据来判断下一个记录数据(逐个选择记录数据)。区别于传统:判断需要生成的文本可能关注哪些记录数据,或者先全部选好以及排序后再来生成描述文本。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。