当前位置:   article > 正文

基于LSTM的短期股票预测_lstm预测股票

lstm预测股票

 

目录

1.原始RNN的问题

2.LSTM

(1)原理

(2)Tensorflow2描述LSTM层

(3)LSTM股票预测


1.原始RNN的问题

        RNN面临的较大问题是无法解决长跨度依赖问题,即后面节点相对于跨度很大的前面时间节点的信息感知能力太弱,如下图中的两句话:左上角的句子中sky可以由较短跨度的词预测出来,而右下角中的French与较长跨度之间的France有关系,即长跨度依赖,比较难预测。

         长跨度依赖的根本问题在于,多阶段的反向传播后导致梯度消失、梯度爆炸。可以使用梯度截断去解决梯度爆炸问题,但无法轻易解决梯度消失问题。

        下面举一个例子来解释RNN梯度消失和爆炸的问题:

        假设时间序列有三段,h_{0}为给定值,且为了简便假设没有激活函数和偏置,则RNN得前向传播过程如下:

h_{1}=w_{xh}x_{1}+w_{hh}h_{0}

h_{2}=w_{xh}x_{2}+w_{hh}h_{1}

h_{3}=w_{xh}x_{3}+w_{hh}h_{2}

y_{1}=w_{hy}h_{1}

y_{2}=w_{hy}h_{2}

y_{3}=w_{hy}h_{3}

假设在t=3时刻,损失函数为loss_{3}=\frac{1}{2}(y_{3}-y_true_e)^{2},其余时刻类似。则total_loss=\frac{1}{2}[(y_{1}-y_true_1)^{2}+(y_{2}-y_true_2)^{2}+(y_{3}-y_true_3)^{2}]。梯度下降法训练就是对参数分别求偏导,然后按照梯度反方向调整他们使loss值变小得过程。假设只考虑t=3时刻得loss=loss_{3} ,这里考虑w_{hh}的偏导:

               可以看出,只有三个时间点时,w_{hh}的偏导与w_{hh}的平方成正比。传统循环网络RNN可以通过记忆体实现短期记忆进行连续数据的预测,但是当连续数据的序列变长时会展开时间步长过长。当时间跨度变长时,幂次将变大。所以,如果w_{hh}为一个大于0小于1的数,随着时间跨度的增长,偏导值将会趋于0;同理,当w_{hh}较大时,偏导值将趋于无穷。这就是梯度消失和爆炸的原因。

2.LSTM

        LSTM由Hochreiter&Schmidhuber于1997年提出,通过门控单元很好的解决了RNN长期依赖问题。

(1)原理

          有兴趣的去看这篇文章吧,讲的很清楚也很明白了

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

(2)Tensorflow2描述LSTM层

  1. tf.keras.layers.LSTM(
  2.     units,
  3.     activation='tanh',
  4.     return_sequences=False
  5. )

其中,units为神经元个数,activation为激活函数,默认为tanh,return_sequences为是否全部时刻返回输出,默认为False。

(3)LSTM股票预测

  1. # -*- coding: utf-8 -*-
  2. # @Time : 2022/10/2 15:15
  3. # @Author : 中意灬
  4. # @FileName: 基于LSTM的股票预测.py
  5. # @Software: PyCharm
  6. """第一步:导入相关的库"""
  7. import math
  8. import os.path
  9. import tensorflow as tf
  10. import tushare as ts
  11. import numpy as np
  12. import tensorflow
  13. import pandas as pd
  14. from tensorflow.keras.layers import Dense,LSTM,Dropout
  15. import matplotlib.pyplot as plt
  16. from tensorflow.keras import Model
  17. from sklearn.preprocessing import MinMaxScaler
  18. from sklearn.metrics import mean_squared_error,mean_absolute_error
  19. """第二步:准备数据"""
  20. datapath='/data.csv'
  21. if os.path.exists(datapath):
  22. print("==========loading data==========")
  23. data=pd.read_csv(datapath)
  24. training_set=data.iloc[0:2427-300,2:3]
  25. test_set=data.iloc[2427-300:,2:3]
  26. else:
  27. ts.set_token('f9e62b42d9f31fbf0267d9ba52204d37c5fef60f3d6091e9820c40a1') # 这儿的token需要自己去turshare注册申请
  28. df = ts.get_k_data('600519', ktype='D', start='2012-01-01', end='2022-01-01')
  29. df.to_csv(datapath)
  30. data = pd.read_csv('./data.csv')
  31. training_set = data.iloc[0:2427 - 300, 2:3].values
  32. test_set = data.iloc[2427 - 300:, 2:3].values
  33. #归一化
  34. sc=MinMaxScaler(feature_range=(0,1))#初始化对象定义归一化:归一化到(0-1)间
  35. training_set_scaler=sc.fit_transform(training_set)#求得训练集的最大值,最小值这些训练集固有的属性(反归一化所需要这些属性),并在训练集上进行归一化
  36. test_set=sc.transform(test_set)#利用训练集的属性对测试集进行归一化
  37. # print(training_set_scaler)
  38. x_train=[]
  39. x_test=[]
  40. y_train=[]
  41. y_test=[]
  42. #利用for循环,遍历整个训练集,将训练集连续60天的数据作为训练特征x_train,第61天数据作为训练标签y_train
  43. for i in range(60,len(training_set_scaler)):
  44. x_train.append(training_set_scaler[i-60:i,0])
  45. y_train.append(training_set_scaler[i,0])
  46. #将训练特征和标签转换神经网络的输入格式,使x_train符合LSTM输入要求:[送入样本数,循环核时间展开步骤,每个时间步输入特征个数]
  47. x_train,y_train=np.array(x_train),np.array(y_train)
  48. x_train=np.reshape(x_train,(len(x_train),60,1))
  49. #利用for循环,遍历整个训练集,将训练集连续60天的数据作为测试特征x_test,第61天数据作为测试标签y_test
  50. for i in range(60,len(test_set)):
  51. x_test.append(test_set[i-60:i,0])
  52. y_test.append(test_set[i,0])
  53. #将测试特征和标签转换神经网络的输入格式,使x_train符合LSTM输入要求:[送入样本数,循环核时间展开步骤,每个时间步输入特征个数]
  54. x_test,y_test=np.array(x_test),np.array(y_test)
  55. x_test=np.reshape(x_test,(len(x_test),60,1))
  56. """第三步:使用class类搭建LSTM神经网络模型"""
  57. class LSTMModel(Model):
  58. def __init__(self):
  59. super(LSTMModel, self).__init__()
  60. self.l1=LSTM(256,activation='tanh',return_sequences=True)
  61. self.d1=Dropout(0.2)
  62. self.l2=LSTM(128,activation='tanh',return_sequences=False)
  63. self.d2=Dropout(0.2)
  64. self.f1=Dense(1)
  65. def call(self,x):
  66. x=self.l1(x)
  67. x=self.d1(x)
  68. x=self.l2(x)
  69. x=self.d2(x)
  70. x=self.f1(x)
  71. return x
  72. """第四步:使用model.compile配置神经网络参数"""
  73. model=LSTMModel()
  74. model.compile(optimizer=tf.keras.optimizers.Adam(0.001),#自己设定adam的学习率,尽量先设置小,大了会收敛过快
  75. loss="mean_squared_error")#不必观察metrics值,没必要,只用观察loss值就可以
  76. checkpoint_save_path="./checkpoint/LSTN.ckpt"
  77. if os.path.exists(checkpoint_save_path+'.index'):
  78. print("==========load the model==========")
  79. model.load_weights(checkpoint_save_path)
  80. cp_callback=tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_save_path,
  81. save_weights_only=True,
  82. save_best_only=True,
  83. moniter='val_loss')
  84. """第五步:用model.fit训练神经网络模型"""
  85. history=model.fit(x_train,y_train,batch_size=32,epochs=50,validation_data=(x_test,y_test),validation_freq=1,callbacks=[cp_callback])
  86. #参数提取
  87. file=open('./weights.txt','w')
  88. for v in model.trainable_variables:
  89. file.write(str(v.name)+'\n')
  90. file.write(str(v.shape)+'\n')
  91. file.write(str(v.numpy())+'\n')
  92. """第六步:使用model.summary打印神经网络结构"""
  93. model.summary()
  94. #绘制loss图像
  95. plt.figure()
  96. plt.plot(history.history['loss'],label='loss')
  97. plt.plot(history.history['val_loss'],label='val_loss')
  98. plt.title('Train and Validation loss')
  99. plt.legend()
  100. plt.show()
  101. #模型预测
  102. predict_stock_openprice=model.predict(x_test)
  103. #对预测数据反归一化
  104. predict_stock_openprice=sc.inverse_transform(predict_stock_openprice)
  105. #对真实数据反归一化
  106. real_stock_openprice=sc.inverse_transform(test_set[60:])
  107. #可视化
  108. plt.figure()
  109. plt.plot(real_stock_openprice,color='r',label='real')
  110. plt.plot(predict_stock_openprice,color='b',label='predict')
  111. plt.legend()
  112. plt.show()
  113. ##模型预测效果量化,数值越小,效果越好
  114. #MSE 均方误差-->E[(预测值-真实值)^2]
  115. mse=mean_squared_error(predict_stock_openprice,real_stock_openprice)
  116. #RMSE 均方误差根-->sqrt(mse)
  117. rmse=math.sqrt(mean_squared_error(predict_stock_openprice,real_stock_openprice))
  118. #MAE 平均绝对误差-->E(|预测值-真实值|)
  119. mae=mean_absolute_error(predict_stock_openprice,real_stock_openprice)
  120. print('均方误差:',mse)
  121. print('均方误差根:',rmse)
  122. print('平局绝对误差:',mae)
  123. #对未知数据预测
  124. preNum=int(input('输入你要预测后多少个数据:'))
  125. a = test_set[len(test_set) - 60:, 0]
  126. c=[]#存储预测后的数据
  127. for i in range(preNum):
  128. b=np.reshape(a,(1,60,1))
  129. pre=model.predict(b)
  130. a=a.tolist()
  131. del a[0]
  132. a.extend(pre[0])
  133. c.extend(pre)
  134. a=np.array(a)
  135. test_set=np.array(test_set)
  136. c=sc.inverse_transform(c)
  137. plt.figure()
  138. plt.plot(sc.inverse_transform(test_set[60:]),color='b',label='real')
  139. x=np.arange(len(test_set[60:]),len(test_set[60:])+preNum)
  140. plt.plot(x,c,color='r')
  141. plt.plot(predict_stock_openprice,color='r',label='predict')
  142. plt.show()

训练集损失 

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/411356
推荐阅读
相关标签
  

闽ICP备14008679号