赞
踩
[论文]Reconstructing Nonlinear Dynamical Systems from Multi-Modal Time Series
[代码]https://github.com/durstewitzlab/mmplrnn
[发表]ICML 2022
[领域]多模态时间序列分析
非线性动力学系统指的是物理、生物、化学等领域中的一类系统,其演化规律不能用简单的线性方程来描述,而是需要用更为复杂的非线性方程来描述。这些系统的行为通常是非常复杂和多变的,涉及到许多因素的相互作用,例如混沌现象、奇异吸引子等。非线性动力学系统的研究对于理解自然界中的各种现象和现象背后的本质机制有着重要的意义,例如气候变化、心脏跳动、流体力学等领域。
稀疏教师强制(Sparse Teacher Forcing)是一种用于生成模型的训练方法,旨在促使模型在生成序列时更加准确和自然。
在常规的教师强制(Teacher Forcing)中,模型在训练过程中接收到真实的序列作为输入,并被要求生成下一个正确的标记。但在生成序列时,由于许多生成标记的概率非常接近,因此模型可能会选择不自然的标记。
稀疏教师强制通过以某种方式强制模型对一定数量的时间步骤执行自我推理,从而缓解了这个问题。在稀疏教师强制中,模型在生成序列的某些时间步骤时将不再接收真实的输入标记,而是将前一个生成的标记作为输入。这样,模型被迫在一些时间步骤上执行自我推理,从而增加了模型在生成时的多样性和准确性。同时,为了防止模型仅仅重复之前生成的标记,稀疏教师强制还会随机选择一定数量的时间步骤来执行自我推理。
稀疏教师强制已被证明在生成模型中具有很高的实用价值,例如在语言生成、机器翻译和图像生成等领域。
ELBO是Evidence Lower Bound的缩写,是一种用于变分推断的目标函数。在概率编码模型中,我们通常希望推断潜在变量(例如,在生成模型中的隐变量),以便估计模型的参数或进行推理。变分推断是一种用于近似推断潜在变量的技术,其中我们试图最小化推断分布与真实后验分布之间的差异。
ELBO是一个较小的下限,该下限给出了模型的证据的下限,即模型中观察到的数据的对数似然。具体地说,ELBO由两个部分组成:第一个部分是推断分布与真实后验分布之间的KL散度(也称为KL散度项),第二个部分是对数似然项。最小化ELBO等价于最大化对数似然,并鼓励推断分布与真实后验分布之间的差异最小化。因此,ELBO是一种在变分推断中常用的优化目标。
- 将不同类型的时间序列数据融合在一起,需要使用多模态变分自编码器(MVAE)来将它们映射到一个共同的潜在空间中,然后再使用这个共同的潜在空间作为递归神经网络(RNN)的输入。
- MVAE的训练包括两个步骤。第一步是训练单独的自编码器来重构每种类型的时间序列数据。第二步是训练MVAE来将所有自编码器的潜在空间映射到一个共同的潜在空间中。这可以通过最大化变分下界来实现。
- 训练RNN时,可以使用稀疏教师强制(TF)来训练模型。稀疏教师强制是一种强制训练技术,可以使神经网络在输入序列中学习关键时刻的表示,并使神经元对于不同的时间步骤具有不同的激活程度。这种技术可以帮助RNN学习动力学系统的时间变化规律。
- TF训练的过程是,在每个时间步骤上,将训练数据的真实值和RNN的输出值之间的误差作为损失函数,同时还引入一个额外的正则化项,这个正则化项是在整个时间序列上的。这个正则化项可以控制神经元在整个时间序列中的平均激活水平,从而实现稀疏性。
- 综上所述,通过使用MVAE将不同类型的时间序列数据融合在一起,并使用稀疏教师强制训练RNN,可以实现对动力学系统的重构。
总的来说,该方法的关键在于将不同类型的时间序列数据融合在一起,以提高重构动力学系统的准确性和鲁棒性。同时,通过稀疏教师强制方法可以更好地处理在混沌动力学系统上训练机器学习模型的挑战,从而提高模型的性能。
提出了一种新的方法来从多模态时间序列数据中重构非线性动力学系统。该方法使用多模态变分自编码器(MVAE)来将不同类型的时间序列数据融合在一起,并使用稀疏教师强制(TF)训练递归神经网络(RNN)进行预测和重构。
这个方法在实验中证明了对于具有不同类型的时间序列数据(如位置、速度和加速度等),能够更好地捕捉系统的动态行为,从而提高对动力学系统的重构和预测的准确性。
该方法的贡献不仅是在非线性动力学系统的研究中,而且在其他领域,例如金融、环境科学和生物医学等领域也有应用的潜力。同时,该方法也为多模态时间序列数据的融合提供了新的思路和技术手段。
许多自然现象,从物理学到心理学,以及许多工程系统,都可以被描述为(通常是非线性的)动力系统,其时间演变由一组微分或时间递归方程指定。循环神经网络可以用来推断这些方程。重建底层DS比训练系统对时间序列产生良好的提前预测更具挑战性,因为模型还必须重现底层系统的不变属性。
许多自然和工程DS可以通过产生时间序列的许多不同的测量通道来观察。结合这些不同的数据流可能有助于深入了解底层的DS,也可能相互补充,并有助于识别系统。
提出一种多模态数据集成方法,用于从观察到的时间序列中重建潜在的非线性DS,这些时间序列来自不同分布模型描述的定性不同数据域。期望最大化(EM)和变分推理(VI)方法都是为训练整个系统而开发的。
从多模数据进行DS重建的模型框架可以简单概括为以下三个步骤:
(1)生成多模式RNN模型:首先,将不同类型的时间序列数据输入到多模态变分自编码器(MVAE)中,对每个模态进行特征提取和降维。然后,将提取的特征输入到生成多模式RNN模型中,该模型是一种递归神经网络(RNN),可以对动力学系统的时间演化进行建模。
(2)模型训练的期望最大化(EM):对于多模式RNN模型的训练,采用期望最大化(EM)算法进行优化。在E步中,根据当前模型参数,通过变分推断估计DS的潜在变量分布。在M步中,根据E步中得到的潜在变量分布和数据,通过最大化对数似然函数来更新模型参数。
(3)模型训练的变分推断:在训练期间,采用变分推断(Variational Inference)来估计DS的潜在变量分布。变分推断是一种近似推断方法,它通过优化某个变分目标函数,使得近似分布尽可能接近真实的后验分布。在M步中,变分推断用于优化期望下界,该下界用于最大化对数似然函数。
PLRNN推理的EM算法已被证明可以有效地处理小型数据集,但缺乏灵活性。多元高斯模型用于近似真实后验,其中均值和协方差矩阵由神经网络参数化。
我们使用重新参数化技巧,通过随机梯度变分贝叶斯对变分和生成模型参数进行了联合优化。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。