论文笔记|GSum: A General Framework for Guided Neural Abstractive Summarization

作者：小舞很执着 | 2024-07-15 09:35:08

踩

gsum

在这里插入图片描述

作者：景
单位：燕山大学

论文来源:NAACL2021
代码地址

前言

生成式摘要神经网络模型很灵活，可以产生连贯的摘要，但它们有时不可靠并且难以控制。虽然以前的研究试图提供不同类型的指导来控制模型输出和增加可信度，但尚不清楚这些策略如何相互比较和对比。在本文中，作者提出了一个通用且可扩展的引导式摘要框架GSum，它可以有效地将不同种类的外部引导作为输入，并在几个不同的品种上进行实验。实验表明，该模型是有效的，在使用突出显示的句子作为指导时，根据 ROUGE 在 4 个流行的摘要数据集上实现了最先进的性能。此外，作者提出的引导式摘要模型可以生成更可信的摘要，并展示了不同类型的引导如何生成质量不同的摘要，从而为学习模型提供一定程度的可控性。

方法

模型

模型的整体架构如下图所示。
在这里插入图片描述

首先是源文档输入，经过分词工具转Embedding之后输入一个emmm,一个Transformer Encoder里，假定每一层的输入信息为 $X$ （ $X$ 是源文档的嵌入，用 $G$ 表示指引文本的嵌入信息），则
$LN(X+SelfAttention(X))\\ X=LN(X+FeedForward(X))\\$
同样的，针对指引文本的嵌入信息G，也有

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小舞很执着/article/detail/828669