赞
踩
深度学习方法用于时间序列预测,如销量预测等,在某些情况下已经能超越基于统计的方法/机器学习方法,相对而言,深度学习方法可以简化特称抽取的过程。
本文介绍2020年的一篇论文。TFT:Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting
预测任务往往需要对输入特征对结果的影响程度进行排序,通常经过多层变换的Multi-head Attention难以提供这种可解释性。因此,论文设计了一个单层的Multi-head Attention层。
可以看到多个Head都是Attend to相同的Value,最后加总平均一下而已,并没有像原本的MHA对Value划分不同的子空间。(感觉这样的“多头”的意义不大?)
使用LSTM encoder-decoder结构,超越传统的统计机器学习方法。
使用Transformer的encoder-decoder结构,引入未来知识,相当于TFT的将来known input。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。