当前位置:   article > 正文

时间序列模型算法 - ARIMA (一)_时间序列算法

时间序列算法

1.时间序列模型概述

时间序列是研究数据随时间变化而变化的一种算法。是一种预测性分析算法。它的基本出发点就是事物发展都有连续性,按照它本身固有的规律进行。

时间序列的常用算法包括:
在这里插入图片描述
有这几个那如何选择模型呢

首先我们要知道时间序列就是按照时间顺序排列,随时间变化的随机过程,也就是说有对应的均值、方差、协方差等。
时间序列可以解决在只有时间(序列项)而没有其他可控变量下对未来数据的预测问题,常用于经济预测、股市预测、天气预测等。

如果随机过程随着时间变化,则此过程是非平稳的,相反,如果随机过程的特征不随时间变化,则此过程为平稳的

  • 如果导致非平稳的原因确定:ES、MA、AR、ARMA
  • 如果是平稳序列:ARIMA

1.1 时间序列的不同分类

时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析。

时间序列根据研究的依据不同,可有不同的分类。

  1. 按研究对象的多少划分,有一元时间序列和多元时间序列。
  2. 按时间的连续性将时间序列分为离散时间序列和连续时间序列两种。
  3. 按序列的统计特性划分,有平稳时间序列和非平稳时间序列。

如果一个时间序列的概率分布与时间t无关,则称该序列为严格的(狭义)平稳时间序列。

如果序列的一、二阶矩存在,而且对任意时刻t满足:

(1)均值为常数

(2)协方差为时间间隔 T 的函数。则称为宽平稳(广义)时间序列。以后研究的时间序列主要是宽平稳时间序列。

  1. 按时间序列的分布规律划分,有高斯型时间序列和非高斯型时间序列。

1.2 确定性时间序列分析方法概述

一个时间序列可以分解为以下四部分:

(1)长期趋势变动。它指时间序列朝一定方向持续上升或下降,或停留在某一水平上,它反映了客观事物的主要变化趋势。

(2)季节变动。

(3)循环变动。通常指周期为一年以上,由非季节因素引起的波形相似的波动。

(4)不规则变动。通常为突然变动和随机变动。

1.3 三种时间序列模型

通常用 T t T_t Tt 表示长期趋势项, S t S_t St 表示季节变动趋势项, C t C_t Ct 表示循环变动趋势项, R t R_t Rt 表示随机干扰项。常见的确定性时间序列模型有以下类型:

(1)加法模型

y t = T t + S t + C t + R t y_t = T_t + S_t + C_t + R_t yt=Tt+St+Ct+Rt

(2)乘法模型

y t = T t ∗ S t ∗ C t ∗ R t y_t = T_t * S_t * C_t * R_t yt=TtStCtRt

(3)混合模型

y t = T t ∗ S t + R t y_t = T_t * S_t + R_t yt=TtSt+Rt

y t = S t + T t ∗ C t ∗ R t y_t = S_t + T_t * C_t * R_t yt=St+TtCtRt

其中 y t y_t yt 是观测目标的观测记录, E ( R t ) = 0 E(R_t) = 0 E(Rt)=0 E ( R t 2 ) = σ 2 E(R^2_{t}) = σ^2 E(Rt2)=σ2

2.指标平滑ES

2.1 一次指数平滑法

线性回归算法中,每个经验点的权重是一致的,即很早以前的经验数据也可能对预测数据有较大的影响。很多实际场景中,未来一段时间的趋势可能和在最近一段时间的趋势关系更加紧密。比如小明去年数学考试成绩一直不及格,今年连续多次考试90多分,预测小明下一次数学考试的成绩,情理上90多分的可能性更高。采用传统的线性回归算法,预测结果可能是70多分。

指数平滑法原则认为,时间越靠过去的经验数据对趋势的影响越小。我们假定时间t的观测值为y(t),时间t的预测值为S(t),则时间t+1的预测值S(t+1)为
S t + 1 = a y t + ( 1 − a ) S t S_{t+1}=ay_t+(1-a)S_t St+1=ayt+(1a)St
a的取值范围在(0,1),a越大,最近时间点的观测值对预测值的影响越大

另外还有二次指数平滑、三次指数平滑,就不介绍,懒得写

3.ACF与PACF

首先来说ACF与PACF是用来确定模型AR(p,)、MA(q,)、ARMA(p,q)、ARIMA(p,l,q),中p、q。方法如下:
在这里插入图片描述

  • 截尾:落在置信区间(95%的点都符合该规则)

如何用PACF图和ACF图来确定p、q值
通常我们确定了模型后,看模型的数据的阶数和2倍标准差范围。

这里先解释一下 阶数就是历史观测项,比如当前时间t数据为 x t x_t xt阶数为7,表示 x t − 7 x_{t-7} xt7

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/458666
推荐阅读
相关标签