赞
踩
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。
时间序列分析中的季节性自回归综合移动平均外生回归模型(Seasonal Autoregressive Integrated Moving Average with eXogenous regressors, SARIMAX)是一种统计建模技术,用于分析和预测具有季节性、趋势以及可能受外部变量影响的时间序列数据。该模型是ARIMA(自回归整合滑动平均模型)的扩展版,加入了对季节性和外生变量的处理能力。
SARIMAX模型的具体组成部分包括:
季节性自回归(Seasonal Autoregression, SAR): 这部分表示模型中包含滞后季节周期的自回归项,例如在月度数据中,如果季节周期为12,则可能会考虑滞后12期、24期等的季节自回归项。
差分整合(Integration, I): 如果原始时间序列是非平稳的,可以通过差分使之变为平稳序列。这里的“d”参数代表需要进行的非季节性差分次数。
移动平均(Moving Average, MA): 模型中包含当前观察值与过去随机误差项的线性组合,这有助于捕捉残差序列中的短期波动模式。
季节性差分(Seasonal Integration, S): 类似于非季节性的差分,这里是指针对季节周期进行的差分操作,以消除季节性趋势。用“D”和“Q”分别表示季节性差分阶数和季节性移动平均阶数。
外生回归(eXogenous Regression, X): 模型中除了自身的历史信息外,还纳入了其他外生变量的影响。这些外生变量可以是连续的或分类的,并且被认为会影响时间序列的行为。
本项目通过SARIMAX算法来构建时间序列分析季节性自回归综合移动平均外生回归模型。
本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:
编号 | 变量名称 | 描述 |
1 | DATE | 日期 |
2 | INDPRO | 工业生产指数 |
数据详情如下(部分展示):
使用Pandas工具的head()方法查看前五行数据:
关键代码:
使用Pandas工具的info()方法查看数据信息:
从上图可以看到,总共有1个变量,数据中无缺失值,共780条数据。
关键代码:
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。
关键代码如下:
用Matplotlib工具的hist()方法绘制直方图:
从上图可以看到,变量主要集中在20~100之间。
从上图中可以看到,房价指数是不断波动的。
主要使用SARIMAX算法,用于季节性自回归综合移动平均外生回归模型。
编号 | 模型名称 | 参数 |
1 | SARIMAX自回归模型 | order=((1, 5, 12, 13) |
2 | trend='c' |
预测结果及展示:
综上所述,本文采用了SARIMAX算法来构建季节性自回归综合移动平均外生回归模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。
- # 本次机器学习项目实战所需的资料,项目资源如下:
-
- # 项目说明:
-
- # 获取方式一:
-
- # 项目实战合集导航:
-
- https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2
-
- # 获取方式二:
-
- 链接:https://pan.baidu.com/s/1CBPrSwUm2IP8wtDWEQzeJA
- 提取码:60ff
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。