赞
踩
时间序列是研究数据随时间变化而变化的一种算法。是一种预测性分析算法。它的基本出发点就是事物发展都有连续性,按照它本身固有的规律进行。
时间序列的常用算法包括:
有这几个那如何选择模型呢
首先我们要知道时间序列就是按照时间顺序排列,随时间变化的随机过程,也就是说有对应的均值、方差、协方差等。
时间序列可以解决在只有时间(序列项)而没有其他可控变量下对未来数据的预测问题,常用于经济预测、股市预测、天气预测等。
如果随机过程随着时间变化,则此过程是非平稳的,相反,如果随机过程的特征不随时间变化,则此过程为平稳的
时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析。
时间序列根据研究的依据不同,可有不同的分类。
如果一个时间序列的概率分布与时间t无关,则称该序列为严格的(狭义)平稳时间序列。
如果序列的一、二阶矩存在,而且对任意时刻t满足:
(1)均值为常数
(2)协方差为时间间隔 T 的函数。则称为宽平稳(广义)时间序列。以后研究的时间序列主要是宽平稳时间序列。
一个时间序列可以分解为以下四部分:
(1)长期趋势变动。它指时间序列朝一定方向持续上升或下降,或停留在某一水平上,它反映了客观事物的主要变化趋势。
(2)季节变动。
(3)循环变动。通常指周期为一年以上,由非季节因素引起的波形相似的波动。
(4)不规则变动。通常为突然变动和随机变动。
通常用 T t T_t Tt 表示长期趋势项, S t S_t St 表示季节变动趋势项, C t C_t Ct 表示循环变动趋势项, R t R_t Rt 表示随机干扰项。常见的确定性时间序列模型有以下类型:
(1)加法模型
y t = T t + S t + C t + R t y_t = T_t + S_t + C_t + R_t yt=Tt+St+Ct+Rt
(2)乘法模型
y t = T t ∗ S t ∗ C t ∗ R t y_t = T_t * S_t * C_t * R_t yt=Tt∗St∗Ct∗Rt
(3)混合模型
y t = T t ∗ S t + R t y_t = T_t * S_t + R_t yt=Tt∗St+Rt
y t = S t + T t ∗ C t ∗ R t y_t = S_t + T_t * C_t * R_t yt=St+Tt∗Ct∗Rt
其中 y t y_t yt 是观测目标的观测记录, E ( R t ) = 0 E(R_t) = 0 E(Rt)=0, E ( R t 2 ) = σ 2 E(R^2_{t}) = σ^2 E(Rt2)=σ2。
线性回归算法中,每个经验点的权重是一致的,即很早以前的经验数据也可能对预测数据有较大的影响。很多实际场景中,未来一段时间的趋势可能和在最近一段时间的趋势关系更加紧密。比如小明去年数学考试成绩一直不及格,今年连续多次考试90多分,预测小明下一次数学考试的成绩,情理上90多分的可能性更高。采用传统的线性回归算法,预测结果可能是70多分。
指数平滑法原则认为,时间越靠过去的经验数据对趋势的影响越小。我们假定时间t的观测值为y(t),时间t的预测值为S(t),则时间t+1的预测值S(t+1)为
S
t
+
1
=
a
y
t
+
(
1
−
a
)
S
t
S_{t+1}=ay_t+(1-a)S_t
St+1=ayt+(1−a)St
a的取值范围在(0,1),a越大,最近时间点的观测值对预测值的影响越大
另外还有二次指数平滑、三次指数平滑,就不介绍,懒得写
首先来说ACF与PACF是用来确定模型AR(p,)、MA(q,)、ARMA(p,q)、ARIMA(p,l,q),中p、q。方法如下:
如何用PACF图和ACF图来确定p、q值
通常我们确定了模型后,看模型的数据的阶数和2倍标准差范围。
这里先解释一下 阶数就是历史观测项,比如当前时间t数据为 x t x_t xt阶数为7,表示 x t − 7 x_{t-7} xt−7。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。