当前位置:   article > 正文

【Python时序预测系列】麻雀算法(SSA)优化LSTM实现单变量时间序列预测(源码)_麻雀搜索优化lstm单变量时间序列预测

麻雀搜索优化lstm单变量时间序列预测

这是我的第269篇原创文章。

一、引言

      麻雀算法(Sparrow Search Algorithm,SSA)是一种基于麻雀群体行为的算法,它可以用来优化深度学习模型中的参数。在优化LSTM模型时,可以通过麻雀算法来调整LSTM的参数,以提高模型的性能和收敛速度。通过麻雀算法优化LSTM模型参数,可以帮助改善模型的性能和泛化能力,加快模型收敛速度,提高预测准确率。同时,麻雀算法还可以帮助发现更优的参数组合,有效地搜索参数空间,提高模型的泛化性能。下面是一个简单的步骤示例,演示如何使用SSA来优化LSTM的超参数。

二、实现过程

2.1 读取数据集

  1. # 读取数据集
  2. data = pd.read_csv('data.csv')
  3. # 将日期列转换为日期时间类型
  4. data['Month'] = pd.to_datetime(data['Month'])
  5. # 将日期列设置为索引
  6. data.set_index('Month', inplace=True)

data:

图片

2.2 划分数据集

  1. # 拆分数据集为训练集和测试集
  2. train_size = int(len(data) * 0.8)
  3. train_data = data[:train_size]
  4. test_data = data[train_size:]
  5. # 绘制训练集和测试集的折线图
  6. plt.figure(figsize=(10, 6))
  7. plt.plot(train_data, label='Training Data')
  8. plt.plot(test_data, label='Testing Data')
  9. plt.xlabel('Year')
  10. plt.ylabel('Passenger Count')
  11. plt.title('International Airline Passengers - Training and Testing Data')
  12. plt.legend()
  13. plt.show()

共144条数据,8:2划分:训练集115,测试集29。

训练集和测试集:

图片

2.3 归一化

  1. # 将数据归一化到 0~1 范围
  2. scaler = MinMaxScaler()
  3. train_data_scaler = scaler.fit_transform(train_data.values.reshape(-1, 1))
  4. test_data_scaler = scaler.transform(test_data.values.reshape(-11))

2.4 构造数据集

  1. # 定义滑动窗口函数
  2. def create_sliding_windows(data, window_size):
  3. X, Y = [], []
  4. for i in range(len(data) - window_size):
  5. X.append(data[i:i + window_size, 0:data.shape[1]])
  6. Y.append(data[i + window_size, 0])
  7. return np.array(X), np.array(Y)
  8. # 定义滑动窗口大小
  9. window_size = 1
  10. # 创建滑动窗口数据集
  11. X_train, Y_train = create_sliding_windows(train_data_scaler, window_size)
  12. X_test, Y_test = create_sliding_windows(test_data_scaler, window_size)
  13. # 将数据集转换为 LSTM 模型所需的形状(样本数,时间步长,特征数)
  14. X_train = np.reshape(X_train, (X_train.shape[0], window_size, 1))
  15. X_test = np.reshape(X_test, (X_test.shape[0], window_size, 1))

2.5 建立模型进行预测

  1. class SSA():
  2. pass
  3. def build_model(X_train, neurons1, neurons2, dropout):
  4. nb_features = X_train.shape[2]
  5. input1 = X_train.shape[1]
  6. model1 = Sequential()
  7. model1.add(LSTM(
  8. input_shape=(input1, nb_features),
  9. units=neurons1,
  10. return_sequences=True))
  11. model1.add(Dropout(dropout))
  12. model1.add(LSTM(
  13. units=neurons2,
  14. return_sequences=False))
  15. model1.add(Dropout(dropout))
  16. model1.add(Dense(units=1))
  17. model1.add(Activation("linear"))
  18. model1.compile(loss='mse', optimizer='Adam', metrics=['mae'])
  19.     return model1
  20.     
  21. UP = [51, 6, 0.055, 9]
  22. DOWN = [50, 5, 0.05, 8]
  23. # 开始优化
  24. ssa = SSA(training, n_dim=4, pop_size=22, max_iter=1, lb=DOWN, ub=UP)
  25. ssa.run()
  26. print('best_params is ', ssa.gbest_x)
  27. print('best_precision is', 1 - ssa.gbest_y)
  28. # 训练模型 使用ssa找到的最好的神经元个数
  29. neurons1 = int(ssa.gbest_x[0])
  30. neurons2 = int(ssa.gbest_x[1])
  31. dropout = ssa.gbest_x[2]
  32. batch_size = int(ssa.gbest_x[3])
  33. model = build_model(X_train, neurons1, neurons2, dropout)
  34. history1 = model.fit(X_train, y_train, epochs=150, batch_size=batch_size, validation_split=0.2, verbose=1,
  35. callbacks=[EarlyStopping(monitor='val_loss', patience=9, restore_best_weights=True)])
  36. # 使用 LSTM 模型进行预测
  37. train_predictions = model.predict(X_train)
  38. test_predictions = model.predict(X_test)
  39. # 反归一化预测结果
  40. train_predictions = scaler.inverse_transform(train_predictions)
  41. test_predictions = scaler.inverse_transform(test_predictions)

best_params:

图片

test_predictions:

图片

2.6 预测效果展示

  1. # 绘制测试集预测结果的折线图
  2. plt.figure(figsize=(10, 6))
  3. plt.plot(test_data, label='Actual')
  4. plt.plot(list(test_data.index)[-len(test_predictions):], test_predictions, label='Predicted')
  5. plt.xlabel('Month')
  6. plt.ylabel('Passengers')
  7. plt.title('Actual vs Predicted')
  8. plt.legend()
  9. plt.show()

测试集真实值与预测值:

图片

  1. # 绘制原始数据、训练集预测结果和测试集预测结果的折线图
  2. plt.figure(figsize=(10, 6))
  3. plt.plot(data, label='Actual')
  4. plt.plot(list(train_data.index)[look_back:train_size], train_predictions, label='Training Predictions')
  5. plt.plot(list(test_data.index)[-(len(test_data)-look_back):], test_predictions, label='Testing Predictions')
  6. plt.xlabel('Year')
  7. plt.ylabel('Passenger Count')
  8. plt.title('International Airline Passengers - Actual vs Predicted')
  9. plt.legend()
  10. plt.show()

原始数据、训练集预测结果和测试集预测结果:

图片

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/700211
推荐阅读
相关标签
  

闽ICP备14008679号