赞
踩
两部分重要内容:1、数据各部分(模型输入、LSTM输入、LSTM输出、模型输出)维度的说明 :注:一定要清楚每个环节输入数据以及输出数据的维度,还有每个维度代表的含义(特别是 batch _size、seq_len、feature_size, timestep, embedding_size 这些变量代表什么。
下面是本项目需要使用的参数以及相关变量,为了方便我们将所有参数封装到一个类中,也可以使用 argparse 参数解析方式。为了说明数据各个阶段的维度变化,特此定义了如下变量大小,小伙伴需要记住下面变量的值一遍理解下文说明各个阶段的维度大小。
- class Config():
- data_path = '../data/wind_dataset.csv'
- timestep = 1 # 时间步长,就是利用多少时间窗口
- batch_size = 32 # 批次大小
- feature_size = 1 # 每个步长对应的特征数量,这里只使用1维,每天的风速
- hidden_size = 256 # 隐层大小
- output_size = 1 # 由于是单输出任务,最终输出层大小为1,预测未来1天风速
- num_layers = 2 # lstm的层数
- epochs = 10 # 迭代轮数
- best_loss = 0 # 记录损失
- learning_rate = 0.0003 # 学习率
- model_name = 'lstm' # 模型名称
- save_path = './{}.pth'.format(model_name) # 最优模型保存路径
-
- config = Config()
'运行
for index in range(len(data) - timestep): dataX.append(data[index: index + timestep][:, 0]) dataY.append(data[index + timestep][0]) dataX = np.array(dataX) dataY = np.array(dataY)
例如,data[0:1]选择数据数组的第一行作为二维子数组,data[:1]是等效的。类似地,data[:,0:1]选择数据数组的第一列作为二维子数组。
这段代码的理解:data[index: index + timestep]
选择了一个连续的时间步数段,其起始索引为 index
,结束索引为 index + timestep
,这里 timestep
是一个预定义的变量。注意,这里的 index
可能是时间序列的起始位置,而 timestep
是所选时间步数段的长度。这段时间步数段的所有列都将包括在所选的子数组中。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。