Li_阴宅

这个屌丝很懒，什么也没留下！

热门标签

时间序列 - 论文笔记本_时间序列机器学习

作者：Li_阴宅 | 2024-07-18 03:47:32

踩

时间序列机器学习

前言：

关于时间序列：我做了很多摸索探究，这里做一个简单的总结记录

文章目录

预测质量评价指标
差分
平滑
深度学习
- - 注意点
论文精读
- 2020 ICLR）N-BEATS: Neural Basis Expansion Analysis For Interpretable Time Series Forecasting
Neural basis expansion analysis with exogenous variables:Forecasting electricity prices with NBEATSx
（Google）Long-term Time Series Forecasting with TiDE: Time-series Dense Encoder
TimesNet
- TimeBlock
AutoFormer
LightCTS
时序异常检测综述

预测质量评价指标

: 可决系数，取值范围为 $+\infty)$ ，其值越大，表示拟合效果越好调用接口为 sklearn.metrics.r2_score，计算公式如下：

$R^2 = 1 - \frac{SS_{res}}{SS_{tot}}$

: 即所有单个观测值与算术平均值的偏差的绝对值的平均。这是一个可解释的指标，因为它与初始系列具有相同的计量单位。取值范围为 $+\infty)$ ，调用接口为 sklearn.metrics.mean_absolute_error ，计算公式如下：

$\frac{\sum\limits_{i=1}^{n} |y_i - \hat{y}_i|}{n}$

: 与平均绝对误差类似，即所有单个观测值与算术平均值的偏差的绝对值的中值。而且它对异常值是不敏感。取值范围为 $+\infty)$ ，调用接口为 sklearn.metrics.median_absolute_error ,计算公式如下： $median(|y_1 - \hat{y}_1|, ... , |y_n - \hat{y}_n|)$

：最常用的度量标准，对大偏差给予较高的惩罚，反之亦然，取值范围为 $+\infty)$ ，调用接口为 sklearn.metrics.mean_squared_error ,计算公式如下： $\frac{1}{n}\sum\limits_{i=1}^{n} (y_i - \hat{y}_i)^2$

: 这个与均方差类似，通过对均方差取对数而得到。因此，该评价指标也更重视小偏差。这指标通常用在呈指数趋势的数据。取值范围为 $+\infty)$ ，调用接口为 sklearn.metrics.mean_squared_log_error ,计算公式如下：
$\frac{1}{n}\sum\limits_{i=1}^{n} (log(1+y_i) - log(1+\hat{y}_i))^2$

平均绝对百分比误差：这与 MAE 相同，但是是以百分比计算的。取值范围为 $+\infty)$ ，计算公式如下： $\frac{100}{n}\sum\limits_{i=1}^{n} \frac{|y_i - \hat{y}_i|}{y_i}$

平均绝对百分比误差的实现如下：

def mean_absolute_percentage_error(y_true, y_pred):
    return np.mean(np.abs((y_true - y_pred) / y_true)) * 100
1
2
'运行

导入上述的评价指标:

from sklearn.metrics import (mean_absolute_error, mean_squared_error,
                             mean_squared_log_error, median_absolute_error,
                             r2_score)
1
2
3

差分

为什么要差分？

自回归模型在概念上类似于线性回归，后者所做的假设在这里也成立。

时间序列数据必须是静止的，以消除与过去数据的任何明显相关性和共线性。

也就是，在固定时间序列数据中，样本观察的属性或值不取决于观察它的时间戳。

例如，给定一个地区的年度人口的假设数据集，如果观察到人口每年增加两倍或增加固定数量，则该数据是非平稳的。
任何给定的观察都高度依赖于年份，因为人口价值将取决于它与任意过去一年的差距。在使用时间序列数据训练模型时，这种依赖性会导致不正确的偏差。

为了消除这种相关性，ARIMA 使用差分使数据平稳。最简单的差分涉及取两个相邻数据点的差值。

在这里插入图片描述
例如，上图左图显示了谷歌 200 天的股价。右边的图是第一张图的不同版本——这意味着它显示了谷歌股票 200 天的变化。在第一张图中可以观察到一种模式（每过100天就会上涨），这些趋势是非平稳时间序列数据的标志。

然而，在第二张图中没有观察到趋势或季节性，也没有观察到增加的方差。因此，我们可以说差分版本是平稳的。

平滑

一般情况下，处理时间序列的核心任务就是根据历史数据来对未来进行预测。这可以通过许多模型来完成。先来介绍一个最老也是最简单的模型：移动平均。

在移动平均中，假设 $\hat{y}_{t}$ 仅仅依赖 $k$ 个最相近的值，对这 $k$ 个值求平均值得到 $\hat{y}_{t}$ 。公式如下式所示： $\hat{y}_{t} = \frac{1}{k} \displaystyle\sum^{k}_{n=1} y_{t-n}$

很明显，这种方法不能预测未来很久的数据。因为，为了预测下一个的值，就需要实际观察到之前的值。但这种方法可以对原始数据进行平滑。在进行平滑时，窗口越宽，也就是 k 的值越大，趋势越平滑。对于波动非常大的数据，这种处理可以使其更易于分析。

we try something！

通过举个例子来进行说明，这里有一份真实的手机游戏数据，记录的是用户每小时观看的广告和每天游戏货币的支出

画图函数

def plotMovingAverage(
    series, window, plot_intervals=False, scale=1.96, plot_anomalies=False
):
    """
    series - 时间序列
    window - 滑动窗口尺寸 
    plot_intervals -置信区间
    plot_anomalies - 显示异常值 
    """
    rolling_mean = series.rolling(window=window).mean()

    plt.figure(figsize=(15, 4))
    plt.title("Moving average\n window size = {}".format(window))
    plt.plot(rolling_mean, "g", label="Rolling mean trend")

    # 画出置信区间
    if plot_intervals:
        mae = mean_absolute_error(series[window:], rolling_mean[window:])
        deviation = np.std(series[window:] - rolling_mean[window:])
        lower_bond = rolling_mean - (mae + scale * deviation)
        upper_bond = rolling_mean + (mae + scale * deviation)
        plt.plot(upper_bond, "r--", label="Upper Bond / Lower Bond")
        plt.plot(lower_bond, "r--")

        # 画出奇异值，upper_bond:上界 ，lowwer_bond下界
        if plot_anomalies:
            anomalies = pd.DataFrame(index=series.index, columns=series.columns)
            anomalies[series < lower_bond] = series[series < lower_bond]
            anomalies[series > upper_bond] = series[series > upper_bond]
            plt.plot(anomalies, "ro", markersize=10)

    plt.plot(series[window:], label="Actual values")
    plt.legend(loc="upper left")
    plt.grid(True)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
'运行

原始数据集可视化

窗口平滑（hour=4）
窗口平滑（hour=12）
窗口平滑（hour=24）

平滑的目的不是预测的有多准确，而是得到变化趋势，上图所示，是24小时（每天的趋势）

当对时间数据进行平滑时，可以清楚的看到整个用户查看广告的动态过程。在整个周末期间（2017-09-16），整个值变得很高，这是因为周末许多人都会有更多的时间。

给出置信区间

在这里插入图片描述
置信区间：【rolling_mean - (mae + scale * deviation)，rolling_mean + (mae + scale * deviation)】

找出异常值

在这里插入图片描述

在这里的检测结果出乎意料，从图中可以看到该方法的缺点：它没有捕获数据中的每月季节性，并将几乎所有的峰值标记为异常。

指数平滑

与加权平滑不同，加权平滑只是加权时间序列最后的 k 个值，而则是一开始加权所有可用的观测值，而当每一步向后移动窗口时，进行指数地减小权重，这个过程可以使用下面的公式进行表达。 $\hat{y}_{t} = \alpha \cdot y_t + (1-\alpha) \cdot \hat y_{t-1}$

这里，预测值是当前真实值和先前预测值之间的加权平均值。本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】