赞
踩
作者指出:社交媒体上假新闻检测的独特挑战之一是如何识别新出现的事件的假新闻。 不幸的是,大多数现有方法几乎无法应对这一挑战,因为它们倾向于学习无法转移到未见过事件的特定于事件的特征。
然后作者提出了一个名为 Event Adversarial Neural Network (EANN) 的端到端框架,它可以派生事件不变的特征,从而有利于检测新到达事件的假新闻。 它由三个主要组件组成:多模态特征提取器、假新闻检测器和事件鉴别器。 多模态特征提取器负责从帖子中提取文本和视觉特征。 它与假新闻检测器合作,学习用于检测假新闻的可辨别表示。 事件鉴别器的作用是去除事件特定的特征并保持事件之间的共享特征。
作者提出了谣言带来的危害以及谣言检测的相关工作,但发现他们任然无法在新出现的和时间紧迫的事件中检测假新闻。而且现在的模型都倾向于捕获许多不同时间之间不共享的特定于事件的特征,这些特定于时间的功能虽然能够帮助对已验证事件的帖子进行分类,但会损害对新出现事件的检测。 出于这个原因,我们相信学习所有事件之间的共享特征将有助于我们从未经验证的帖子中检测假新闻,而不是捕获特定于事件的特征。
而要删除特定于事件的特征,第一步是识别他们,对于不同事件的帖子,他们有自己独特的功能,这些帖子可以用学习到的特征来表示,因此,识别特定事件的特征等同于测量不同事件的学习特征之间的差异。
如何有效地估计这种情况下的差异是我们必须解决的挑战,受对抗网络思想的启发,我们在训练阶段结合事件鉴别器来预测事件辅助标签,相应的损失可用于估计不同事件之间特征表示的差异。 损失越大,差异越小。
本文的主要贡献可以总结如下:
在2.1小结 Fake News Detection,作者总结了谣言检测的相关工作,并提出了这些工作存在的不足,然后提出了自己的EANN模型。
在2.2小结作者介绍了对抗网络。
Model Overview
模型概述:作者提出的模型有三个部分,首先是多模态提取器,将文本和视觉特征连在一起形成最终表示,接着是假新闻检测器和事件鉴别器,这两个部分的输入其实是多模态特征提取器的输出,假新闻检测室预测帖子是真是假,事件鉴别器潜在表示识别每个帖子的事件标签。
Multi-Modal Feature Extractor
多模态特征提取器有两个部分组成:文本特征提取和图像特征提取。
Textual Feature Extractor
它利用具有不同窗口大小的多个过滤器来捕获不同粒度的特征来识别假新闻。文本中的每个单词都表示为一个词嵌入向量。 每个词的嵌入向量使用给定数据集上的预训练词嵌入进行初始化。对于句子中的第 i 个词,对应的 k 维词嵌入向量表示为 Ti ∈ Rk 。 因此,一个包含 n 个单词的句子可以表示为:
⊕ 是串联运算符
一个窗口大小为 h 的卷积滤波器将句子中 h 个单词的连续序列作为输入并输出一个特征
这里 σ (·) 是 ReLU 激活函数,Wc 表示滤波器的权重。
然后我们得到这个句子的特征向量:
对于每一个句子,我们使用max-pooling提取操作最大值,重复操作,直到得到所有过滤器的特征。为了提取具有不同粒度的文本特征,应用了各种窗口大小。在最大池化操作之后,使用全连接层来确保最终的文本表示通过以下操作与视觉特征表示相同的维度(p):
其中 Wt f 是全连接层的权重矩阵。
Visual Feature Extractor
RF = RT ⊕ RV ∈ R2p
,它是多模态特征提取器的输出。 我们将多模态特征提取器表示为 Gf (M; θf )
,其中 M,通常是一组文本和视觉帖子,是多模态特征提取器的输入,θf 表示要学习的参数。3.3 Fake News Detector
新闻检测器将多模态特征提取器的结果RF作为输入,表示为Gd(RF;Θd), 其中Θd表示包含的所有参数。第i个多媒体帖子的假新闻检测器的输出表示为mi,是该帖子是假帖子的概率:
使用 Yd 来表示标签集并使用交叉熵来计算检测损失:
调参来找到最小loss:
检测假新闻损失最小化有助于检测假新闻,但是这些特定于事件的特征,并不能很好的解决作者所提出的挑战,因此,模型要学习更一般的特征表示,这些特征表示可以捕获所有事件之间的共同特征。所以需要去除每个事件的唯一性,特别是测量不同事件之间特征表示的差异并将它们删除以捕获时间不变的特征表示。
Event Discriminator
事件鉴别器是一个神经网络,由两个具有相应激活函数的全连接层组成。 它旨在基于多模态特征表示将帖子正确分类为 K 个事件之一。 我们将事件鉴别器表示为 Ge (RF ; θe )
,其中 θe 表示其参数。 我们通过交叉熵定义事件鉴别器的损失,并使用 Ye 来表示事件标签的集合:
最小化损失的参数:
上述想法激发了多模态特征提取器和事件鉴别器之间的极小极大博弈。 一方面,多模态特征提取器试图欺骗事件判别器以最大化判别损失,另一方面,事件判别器旨在发现特征表示中包含的事件特定信息以识别事件。
Model Integration
在训练阶段,多模态特征提取器 Gf (Wtf; θf ) 需要与假新闻检测器 Gd (RF; θd ) 配合以最小化检测损失 Ld (θf , θd ),从而提高假新闻检测器的性能 新闻检测任务。 同时,多模态特征提取器 Gf ((Wtf; θf ) 试图通过最大化事件判别损失 Le (θf , θe ) 来欺骗事件鉴别器 Ge (RF; θe ) 以实现事件不变表示。 事件鉴别器 Ge (RF; θe) 试图通过最小化事件鉴别损失来基于多模态特征表示来识别每个事件。 我们可以将这个三人游戏的最终损失定义为:
其中 λ (设置为1)控制假新闻检测和事件识别的目标函数之间的权衡。我们寻求的参数集是最终目标函数的鞍点:
使用随机梯度下降来解决上述问题。 θf 根据方程式更新
衰减学习率η:
其中 α = 10, β = 0.75, p 从 0 到 1 线性变化,对应于训练进度。 算法 1 总结了所提出的事件对抗神经网络 (EANN) 的详细步骤。
数据集: Twitter 和微博
结果:
作者的谣言检测新颖之处在于,他的EANN模型在检测最新出现的新闻上有较好的表现,为了能够检测最新出现的新闻,作者通过获取不同事件帖子的特征,然后计算这些特征之间的差异并想办法删去这些差异找到他们的共同特征。模型由三个部分,多模态特征提取器,事件鉴别器和假新闻检测器。其中多模态提取器融合例如帖子的视觉和文本特征,使用基于CNN的网络提取文本特征,与CNN不同的地方在于作者使用了不同窗口大小的滤波器来获取不同粒度的特征,并用预选了的VGG19提取视觉特征,在最后加了一个全连接层。事件鉴别器是采用对抗网络的思想,由带有激活函数的两个全连接层组成,与多模态特征结合来鉴别假新闻,假新闻检测器将多模态特征作为输入鉴别新闻是真是假。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。