赞
踩
提出了一种特征分解的多模态情感识别方法,学习每种模态的共同和私有的特征表征。
提出了一种特征解缠方法,同时提出了一种基于注意力机制的跨模态融合方法
提出了多模态的递归中间层聚合模型,以探索利用深度预训练转化器的中间表征之间的多模态互动来实现端到端的情感识别的有效性。
提出通过多组聚类和隐私无关的混合聚合来进行基于视频的情绪识别的联邦学习的实用框架。
关键词: 视频识别, 情感计算, 联邦学习。
为了解决情绪的模糊性问题,提出了情感模糊-敏感合作网络(EASE)。
在每个mini batch中使用两个peer networks从噪声图像中学习,两个网络都计算样本的损失值。然后将样本分为三组:。每个网络从其对等网络选择的训练样本中更新参数,并将类别概率与对等网络进行匹配,以校准网络的过拟合。最后,引入了多样性增强模块来提高两个的peer networks合作能力。
本文重点讨论了一个有趣的任务,即无监督的跨语料库语音情感识别,其中标记的训练(源)语料库和未标记的测试(目标)语料库具有不同的特征分布,导致源域和目标域之间存在差异,因此提出了一种无监督的域适应方法,整合了Transformer和互感信息(MI),能够用于跨语料库的SER。
提出了一个多模态架构,利用基于模态的变换器模型来结合视频帧、音频记录和文本注释进行情绪识别。ViPER适合应对MuSe - Reaction挑战,该挑战旨在预测观看视频片段的人的情绪唤醒度。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。