赞
踩
引用: Cao D , Wang Y , Duan J ,et al.Spectral Temporal Graph Neural Network for Multivariate Time-series Forecasting[J]. 2021.DOI:10.48550/arXiv.2103.07719.
论文链接: [2103.07719] Spectral Temporal Graph Neural Network for Multivariate Time-series Forecasting
作者: Defu Cao, Yujing Wang, Juanyong Duan, Ce Zhang, Xia Zhu, Conguri Huang, Yunhai Tong, Bixiong Xu, Jing Bai, Jie Tong, Qi Zhang
机构: 北京大学、微软和苏黎世联邦理工学院
在这篇论文中,多变量时间序列预测问题被定义为基于一个称为多变量时间图(multivariate temporal graph)的数据结构进行的预测任务。具体定义如下:
多变量时间图:表示为 $ G = (X, W) $,其中:
预测任务:给定过去 K K K 个时间戳的观测值 X t − K , … , X t − 1 X_{t-K}, \ldots, X_{t-1} Xt−K,…,Xt−1 ,多变量时间序列预测的目标是预测多变量时间图 G = ( X , W ) G = (X, W) G=(X,W) 中下一个 H H H 个时间戳的节点值 X ^ t , X ^ t + 1 , … , X ^ t + H − 1 \hat{X}_t, \hat{X}_{t+1}, \ldots, \hat{X}_{t+H-1} X^t,X^t+1,…,X^t+H−1 。这些值可以通过预测模型 F F F 与参数 Φ \Phi Φ 以及图结构 G G G 来推断,其中 G G G 可以作为先验输入或从数据中自动推断。
预测模型:可以表示为 X ^ t , X ^ t + 1 , … , X ^ t + H − 1 = F ( X t − K , … , X t − 1 ; G ; Φ ) \hat{X}_t, \hat{X}_{t+1}, \ldots, \hat{X}_{t+H-1} = F(X_{t-K}, \ldots, X_{t-1}; G; \Phi) X^t,X^t+1,…,X^t+H−1=F(Xt−K,…,Xt−1;G;Φ)。
这个定义强调了在多变量时间序列预测中同时考虑时间序列内部的时序模式和不同时间序列之间的相关性的重要性。StemGNN 模型正是为了捕捉这些复杂的结构和时序依赖性而设计的。
输入层:多变量时间序列数据 X X X 作为输入,其中 X ∈ R N × T X∈R^{N \times T} X∈RN×T, N N N 是时间序列的特征数量, T T T 是时间步的数量。
潜在相关性层(Latent Correlation Layer):
潜在相关性层(Latent Correlation Layer)是StemGNN模型中用于自动学习多变量时间序列之间潜在相关性的组件,这层的目的是在没有预定义的拓扑结构的情况下,从数据中自动推断出时间序列之间的相互关系。以下是潜在相关性层的详细描述:
自注意力机制(Self-Attention Mechanism):
输入:
GRU层(Gated Recurrent Unit Layer):
权重矩阵计算:
使用GRU层的最后一个隐藏状态 R R R 作为整个时间序列的表示,然后通过自注意力机制计算权重矩阵 W W W 。计算公式如下:
Q = R W Q , K = R W K , W = Softmax ( Q K T d ) Q = R W^Q, \quad K = R W^K, \quad W = \text{Softmax}\left(\frac{QK^T}{\sqrt{d}}\right) Q=RWQ,K=RWK,W=Softmax(d QKT)
其中, Q Q Q 和 K K K 分别表示查询(query)和键(key)的表示, W Q W^Q WQ 和 W K W^K WK 是可学习的参数, d d d 是 Q Q Q 和 K K K 的隐藏维度大小。
邻接矩阵:
StemGNN 层:
由多个 StemGNN 块组成,每个块包含以下操作:
图傅里叶变换(Graph Fourier Transform, GFT):将图 G G G 转换为频谱矩阵表示,使得每个节点的单变量时间序列在线性上独立,以便于分析和处理数据中的周期性和趋势性特征。首先计算图拉普拉斯矩阵 L L L 的特征值和特征向量.然后,使用这些特征向量构造变换矩阵,将原始的时间序列数据投影到这些特征向量上,实现从图域到频域的转换,具体如下:
图拉普拉斯矩阵:
特征值分解:
变换过程:
频域表示:
逆变换:
离散傅里叶变换(Discrete Fourier Transform, DFT):将每个单变量时间序列转换到频域。
卷积和门控线性单元(Convolution and Gated Linear Unit, GLU):在频域中捕获特征模式。
逆图傅里叶变换(Inverse Graph Fourier Transform, IGFT):将频谱表示转换回原始域。
Spectral Sequential Cell(Spe-Seq Cell):
输出层:
损失函数:
推理策略:
残差连接和堆叠 StemGNN 块:
基于图卷积的输出:
这篇论文在深度学习领域提供了一种新的多变量时间序列预测方法,通过频谱域的建模提高了预测的准确性,并通过实验验证了其有效性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。