赞
踩
该作用是参考唐宇迪的pytorch框架写的
首先是导入所需库和数据集
首先数据中提供了年月日和当天是星期几,以及前天,昨天和全年的平均的气温。actual就是当天的准确温度,这就是我们的预测,‘friend’指的是一个猜测的温度,这里偏差较大,我们可以忽略它。
简单查看一下当前数据集的维度,可以看见这是一个有348天,每天有9个特征的数据集。当然,数据集中给的年月日和星期的数据并不能直接使用,我们要将它们做一些处理,处理成一些数字化的特征,使用datetime对数据中的年月日进行处理
然后使用pandas中的get_dummies对数据中可能是字符串数据的数据进行重新编码
接着我们得知道对应的标签,还需要把数据中的标签从数据中删除,否则会对我们的输入产生影响
现在我们观察数据,可以发现如果将所有的特征组成向量,那么一些特征元素的值会比较大,一些则会比较小,例如average这个量都是四十多而month都是小于12的。这样的话数据集构成的集会比较偏扁圆,也就是说average这个量相对于小的month这个量对应模型的影响更大,这会导致模型训练不稳定,我们应该让每一个特征元素都能“平等”地对模型进行影响,所以我们需要对模型进行一定的标准化。
可以看到,做完标准化之后数据的浮动范围会更小。
接下来就是构建神经网络模型并对其进行训练了,第一步就是把之前numpy的数据格式转为torch中所需要的tensor格式
接着设置神经网络的权重
这里我们每个数据有14个特征,我们就设置第一层有14个接收量,然后会输出128个特征,第一个偏差就会是有128个特征的向量,第二层同理,最终输出一个气温值。当然,对于每一个参数都要计算梯度。
然后是学习率和损失值,迭代次数设置
神经网络的基本参数构建好了,接下来就是训练过程,首先我们通过第一层的权重,并加上偏差得到隐藏层的值,接着我们要使用激活函数对隐藏的值进行“激活”,激活后的值通过第二层权重并加上第二层的偏差便得到了预测值。通过预测值和真实值的比较得到损失函数,得出损失值。然后通过损失值和反向传播计算出之前的每个参数的梯度,然后运用梯度下降法对参数进行更新。
以上便完成了基本的神经网络模型的构建与训练,当然这种方式容易让结果收敛到局部最小,而且构建比较复杂,但是对于框架的理解可以更加清晰,以下还有一种简单的写法
注意,其中我们训练的x和y只取了部分值
作出图像,可以看到预测效果
蓝线是真实值,红点是预测值。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。