赞
踩
自回归模型用于预测时间序列中将来的值。使用该模型时,通常需要假定一个随机变量的值依赖于它前面的值。另外,该模型还假定前后值之间的关系是线性的,我们要做的就是拟合数据,以便给数据找到适当的参数。
自回归模型的数学公式如下:
上面公式中,c是常量,最后一项是随机分量,又名白噪声。
这给我们提出了一个很常见的线性回归问题,但从实用性考虑,保持模型的简单性十分重要,因此我们只保留必要的滞后分量。按机器学习的专业术语来说,这些叫做特征。处理回归问题时,目前首先会选择使用python的scikit-learn。
进行回归分析时,我们常常会遇到过拟合的问题,这个问题经常出现在对样本的拟合程度非常理想的情况下,这个时候一旦引入新的数据点,其表现立刻变差。对付这个问题的最直观的解决方案便是进行交叉验证,或者使用没有过拟合问题的算法。利用这种方法,我们指将一部分样本用于模型参数的估算,其余数据用于该模型的测试和评估。这实际上是一种简化的解释,现实中有更加复杂的交叉验证方案,其中很多已在scikit-learn中得到支持。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。