搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
你好赵伟
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
VHDL实现分频器_vhdl分频器
2
Android原生项目Flutter混编交互_闲鱼flutter改回原生
3
OpenGL安装教程
4
显示异常Could not create connection to database server解决方法_db connection error! reason :could not create conn
5
LeetCode 省份数量
6
图解NLP模型发展:从RNN到Transformer
7
spring-boot源码解析_springboot源码解读
8
Flink执行流程与源码分析(面试必问,建议收藏)_dispatcherrunner.start();
9
YOLOv3-Pytorch(ultralytics)训练代码报错TypeError: can’t convert cuda:0 device type tensor to numpy. Use Te
10
BGP综合实验报告
当前位置:
article
> 正文
论文笔记:A Time Series is Worth 64 Words: Long-term Forecasting with Transformers_时间序列patch
作者:你好赵伟 | 2024-05-19 09:37:49
赞
踩
时间序列patch
ICLR
2023
比较简单,就不分intro、model这些了
1 核心思想1:patching
给定每个时间段的长度、划分的stride,将时间序列分成若干个时间段
时间段之间可以有重叠,也可以没有
每一个时间段视为一个token
1.1 使用patching的好处
降低复杂度
Attention 的复杂度是和 token 数量成二次方关系。
如果每一个 patch 代表一个 token,而不是每一个时间点代表一个 token,这显然降低了 token 的数量
保持时间序列的局部性
时间序列具有很强的局部性,相邻的时刻值很接近,以一个 patch 为 Attention 计算的最小单位显然更合理
方便之后的自监督表示学习
即 Mask 随机 patch 后重建
减少预测头的参数量
L是输入序列长度,M 是序列个数, T是预测序列长度,D是维度,N是patch数量
论文中的说法是,不分patch的话,Linear Head的大小是LD×MT
这里我觉得有点问题,不分patch的话,输入M*L,经过position embedding+project之后是M*LD,经过Transformer Encoder之后是M*LD,输出是M*T,那么Linear Head的大小应该是LD × T
分patch的话LinearHead的大小是ND × T
但不管我理解的对于否,分patch的话Linear Head的大小肯定是小
2 核心思想2:channel-independence
很多基于Transformer的模型采用了 channel-mixing 的方式
指的是,对于
多元时间序列
,直接将时间序列的所有维度形成的向量投影到嵌入空间以混合多个通道的信息。
Channel-independence 意味着每个输入 token 只包含来自单个通道的信息。
这篇采用了的是Channel-independence
将多元时间序列(维度为 M)中每一维单独进行处理
即将每一维分别输入到 Transformer Backbone 中
将所得预测结果再沿维度方向拼接起来。
这相当于将不同维度视为独立的,但 embedding 和 Transformer 的权重在各个维度是共享的。
3 自监督表示学习
论文说明了分 patch 对 mask 重建来进行自监督学习的好处:
mask 一个时间点的话,直接根据相邻点插值就可以重建,这就完全没必要学习了,而 mask 一个 patch 来重建的话则更有意义更有难度。
4 实验
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/你好赵伟/article/detail/592302
推荐阅读
article
PostgreSQL
JIT
(
Just
-In-
Time
Compilation
)
With
LLVM
...
LLVM
的基本介绍 以及
LLVM
IR 和
LLVM
Orc
JIT
如何在
PostgreSQL
中应用,提升查询性能...
赞
踩
article
BakedSDF
:
Meshing
Neural
SDFs
for
Real
-Time
View
S...
是 Mildenhall 和 Barron 参与的工作(都是谷歌的),同时一作是 Lipman 的学生,VolSDF 的...
赞
踩
article
Volumetric
3D M
a
pp
in
g
in
Re
a
l-Time on
a
CPU_volume...
这篇文章如何将最voxel的更新在CPU的SIMD指令上并行 大概思路如下: 先在空间中建立八叉树, 然后将八叉树细分,...
赞
踩
article
Ansys
Fluent-Meshing: “ No
license
is
avaiable
at
...
Ansys
Fluent Meshing " No
license
is
avaiable
at
th
is
time "...
赞
踩
article
Real
-
Time
Rendering
——16.5
Simplification
简单化_
mesh
s...
Real
-
Time
Rendering
——16.5
Simplification
简单化_
mesh
simplificat...
赞
踩
article
golang
变量
初始化
声明
方法总结_
golang
time
声明
...
golang
变量
初始化
声明
方法总结package mainimport "fmt"func main() { //变量...
赞
踩
article
VRPTW
:蜣螂优化
算法
DBO
求解带时间窗的车辆路径问题(
Vehicle
Routing
Probl...
带时间窗的车辆路径问题(
Vehicle
Routing
Problem
with
Time
Windows
,
VRPTW
...
赞
踩
article
echarts
异步
数据
加载(在下拉框选择事件中异步更新
数据
)_
option
.
series
[
0
].
d
a...
接触
echarts
大半年了,从不会到熟练也做过不少的图表,隔了一段时间没使用这玩意,好多东西真心容易忘了。在接触ech...
赞
踩
article
Elasticsearch
中默认的
日期
格式_
strict
date
optional
time
...
注意,上述映射定义了一种新的
日期
格式,这种格式只包括年月日,不包括时间或时区信息,
日期
格式是 “yyyyMMdd”。幸运...
赞
踩
article
a16_
Python
日期
时间
Date/Time---学习笔记_
%
z
or
%
z
- 时区
或
名称
或
缩写...
Python
程序可以处理多种方式的
日期
和
时间
。
日期
格式之间的转换是一种常见计算机的杂活。
Python
的
时间
和日历模块,...
赞
踩
article
【
leetcode
】5354. 通知
所
有
员工
所
需的
时间
(
Time
Needed
to Inform...
题目描述 【
leetcode
】5354. 通知
所
有
员工
所
需的
时间
(
Time
Needed
to Inform All ...
赞
踩
article
AI论文速读 |【Mambda×时序预测】 时光机(
Time
Machine):A
Time
Seri...
由于捕获长期依赖性、实现线性可扩展性和保持计算效率的困难,长期时间序列预测仍然具有挑战性。推出了
Time
Machine...
赞
踩
相关标签
postgresql
数据库
LLVM
论文阅读
经验分享
渲染管线
golang
开发语言
后端
算法
matlab
VRPTW
javascript
echarts
前端
elasticsearch
jenkins
大数据
leetcode
面试
人工智能
学习
深度学习
数据挖掘