赞
踩
目录
灰色预测应用场景:时间序列预测
灰色预测的主要特点是模型使用的不是原始数据序列,而是生成的数据序列。其核心体系是灰色模型,即对原始数据做累加生成得到近似的指数规律再进行建模的方法。
优点是不需要很多的数据,一般只需要4个数据就可以,能解决历史数据少、序列的完整性及可靠性低的问题;能利用微分方程来充分挖掘系统的本质,精度高;能将无规律的原始数据进行生成得到规律性较强的生成序列,运算简便,易于检验,具有不考虑分布规律,不考虑变化趋势。
缺点是只适用于中短期的预测,只适合指数增长的预测。
由北方某城市1986-1992年道路交通噪声平均值声级数据如表,进行未来10年的预测。
解:
级比检验
首先导入数据,做级比检验
- import pandas as pd
- import numpy as np
- data = pd.read_excel(r"C:\Users\Terry\Desktop\城市交通噪声数据.xlsx")
- x_0 = np.array(data["噪声分贝"].to_list()) # [1,2,3] ndarray
- x_0
- # 级比检验
- def level_ratio_test(x):
- # 可容覆盖范围
- n = len(x)
- cover_range = [np.exp(-2/(n+1)), np.exp(2/(n+1))]
- # 计算x[i]/x[i+1]的值,即计算级比
- lambda_x = x[:-1] / x[1:]
- for i in lambda_x:
- if i < cover_range[0] or i > cover_range[1]:
- print("不通过级比检验,无法使用GM(1,1)")
- return
- print("通过级比检验,可以使用GM(1,1)")
-
- level_ratio_test(x_0)
注:这里直接写了一个函数,计算量可容覆盖范围,循环判断是每个数的级比是否满足要求,如果不满足,跳出循环,并输出无法使用GM(1,1),如果循环结束,仍然没有输出无法使用,则标明所有级比均通过检验可以输出“通过级比检验,可以使用GM(1,1)”
建模及预测
- # 1.计算一次累加生成序列z_1
- x_1 = x_0.cumsum()
-
- # 2.计算均值生成序列z_1
- z_1 = (x_1[:-1] + x_1[1:]) / 2.0
-
- # 3.计算B矩阵
- B = np.vstack([-z_1, np.ones(len(x_0)-1)]).T
-
- # 4.计算Y矩阵
- Y = x_0[1:].reshape((-1, 1))
-
- # 5.计算a,b
- # a为发展系数 b为灰色作用量
- [[a], [b]] = np.linalg.inv(B.T @ B) @ B.T @ Y # 计算参数
-
- # 6.原始年份的预测值
- x_1_predict = []
- n = len(x_0)
- for k in range(n): # 如果预测k个未来年份 这里就n+k 假设预测未来5年就n+5
- x_1_predict.append((x_0[0]-b/a)*np.exp(-a*k) + b/a)
-
- # 7.还原数据
- x_0_predict = np.hstack([x_0[0],np.diff(x_1_predict)])
结果检验
- import pandas as pd
- result = pd.DataFrame({"原始数据":x_0,
- "预测数据":x_0_predict})
- # 残差:真实值 - 预测值
- result["残差"] = result["原始数据"] - result["预测数据"]
- # 相对误差
- result["相对误差"] = (abs(result["原始数据"] - result["预测数据"]) / result["原始数据"]).map('{:.2%}'.format)
- # 级比偏差
- lambda_x = x_0[:-1] / x_0[1:]
- result["级比偏差值"] = np.append(np.nan, abs(1-(1-0.5*a)/(1+0.5*a)*lambda_x))
- result
相对误差、级别偏差均小于0.1,达到较高要求。
结果描述及未来预测
通过绘制折线图来看真实值和预测值的比较
- result = result.set_index(data.年份)
- import pandas as pd
- import matplotlib.pyplot as plt
- import seaborn as sns
- # 输出高清图像
- %config InlineBackend.figure_format = 'retina'
- %matplotlib inline
-
- #设定 seaborn 风格
- sns.set()
- with plt.xkcd():
- #用 matplotlib 画出每个序列的折线
- plt.figure(figsize=(10,6))
- plt.plot(result['原始数据'], label='Original data',marker='o',color='g')
- plt.plot(result['预测数据'], label='Predicted data',marker='X',color='r')
-
- # 设定图例和标题
- plt.legend()
- plt.title('Comparison of Original Data and Predicted Data')
-
- # 设置坐标轴范围
- plt.ylim(60, 85)
- # 显示图表
- plt.show()
- # 假设预测10年
- x_1_predict = []
- for k in range(n+10): # 如果预测k个未来年份 这里就n+k 假设预测未来5年就n+5
- x_1_predict.append((x_0[0]-b/a)*np.exp(-a*k) + b/a) # 递推计算 第k+1个数 比如k=0的时候 就是第一个预测值
- x_1_predict
- # 7.还原数据
- x_0_predict = np.hstack([x_0[0],np.diff(x_1_predict)])
- x_0_predict
-
- year = data["年份"].tolist()
- for i in range(10):
- year.append(year[-1]+1)
- x_0_predict_more = pd.DataFrame({"未来预测":x_0_predict,"年份":year})
- x_0_predict_more = x_0_predict_more.set_index("年份")
- x_0_predict_more.iloc[0:n-1,:] = np.nan
-
- with plt.xkcd():
- #用 matplotlib 画出每个序列的折线
- plt.figure(figsize=(10,6))
- plt.plot(result['原始数据'], label='Original data',marker='o',color='g')
- plt.plot(result['预测数据'], label='Predicted data',marker='X',color='r')
- plt.plot(x_0_predict_more['未来预测'], label='Predicted Future data',marker='1',color='b',linestyle='--')
-
- # 设定图例和标题
- plt.legend()
- plt.title('Comparison of Original Data and Predicted Data')
-
- # 设置坐标轴范围
- plt.ylim(60, 80)
- # 显示图表
- plt.show()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。