当前位置:   article > 正文

Python实现时间序列分析季节性自回归综合移动平均外生回归模型(SARIMAX算法)项目实战_python sarimax模型

python sarimax模型

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

时间序列分析中的季节性自回归综合移动平均外生回归模型(Seasonal Autoregressive Integrated Moving Average with eXogenous regressors, SARIMAX)是一种统计建模技术,用于分析和预测具有季节性、趋势以及可能受外部变量影响的时间序列数据。该模型是ARIMA(自回归整合滑动平均模型)的扩展版,加入了对季节性和外生变量的处理能力。

SARIMAX模型的具体组成部分包括:

季节性自回归(Seasonal Autoregression, SAR): 这部分表示模型中包含滞后季节周期的自回归项,例如在月度数据中,如果季节周期为12,则可能会考虑滞后12期、24期等的季节自回归项。

差分整合(Integration, I): 如果原始时间序列是非平稳的,可以通过差分使之变为平稳序列。这里的“d”参数代表需要进行的非季节性差分次数。

移动平均(Moving Average, MA): 模型中包含当前观察值与过去随机误差项的线性组合,这有助于捕捉残差序列中的短期波动模式。

季节性差分(Seasonal Integration, S): 类似于非季节性的差分,这里是指针对季节周期进行的差分操作,以消除季节性趋势。用“D”和“Q”分别表示季节性差分阶数和季节性移动平均阶数。

外生回归(eXogenous Regression, X): 模型中除了自身的历史信息外,还纳入了其他外生变量的影响。这些外生变量可以是连续的或分类的,并且被认为会影响时间序列的行为。

本项目通过SARIMAX算法来构建时间序列分析季节性自回归综合移动平均外生回归模型。   

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

编号 

变量名称

描述

1

DATE

日期

2

INDPRO

工业生产指数

数据详情如下(部分展示):

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据:

关键代码:

3.2 数据缺失查看

使用Pandas工具的info()方法查看数据信息:

      

从上图可以看到,总共有1个变量,数据中无缺失值,共780条数据。

关键代码:

3.3 数据描述性统计

通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。

关键代码如下:    

4.探索性数据分析

4.1 变量直方图

用Matplotlib工具的hist()方法绘制直方图:

从上图可以看到,变量主要集中在20~100之间。  

4.2 折线图

从上图中可以看到,房价指数是不断波动的。

5.构建SARIMAX自回归模型

主要使用SARIMAX算法,用于季节性自回归综合移动平均外生回归模型。 

5.1 构建模型

编号

模型名称

参数

1

SARIMAX自回归模型

order=((1, 5, 12, 13)

2

trend='c' 

5.2 模型摘要信息

6.模型评估

6.1 模型残差诊断图

6.2 模型预测

预测结果及展示:

7.结论与展望

综上所述,本文采用了SARIMAX算法来构建季节性自回归综合移动平均外生回归模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。  

  1. # 本次机器学习项目实战所需的资料,项目资源如下:
  2. # 项目说明:
  3. # 获取方式一:
  4. # 项目实战合集导航:
  5. https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2
  6. # 获取方式二:
  7. 链接:https://pan.baidu.com/s/1CBPrSwUm2IP8wtDWEQzeJA
  8. 提取码:60ff
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/511333
推荐阅读
相关标签
  

闽ICP备14008679号