赞
踩
代码详解
- # 将训练数据的特征和标签组合
- dataset = Data.TensorDataset(features, labels)
- # 随机读取小批量
- data_iter = Data.DataLoader(dataset, batch_size, shuffle=True)
-
- for X, y in data_iter:
- print(X, y)
- break
-
-
- #利用nn.module实现模型
- # class LinearNet(nn.Module):
- # def __init__(self, n_feature):
- # super(LinearNet, self).__init__()
- # self.linear = nn.Linear(n_feature, 1)
- # # forward 定义前向传播
- # def forward(self, x):
- # y = self.linear(x)
- # return y
- #
- # net = LinearNet(num_inputs)
- # print(net) # 使用print可以打印出网络的结构
-
- #利用squntial容器搭建网络
- net = nn.Sequential(
- nn.Linear(num_inputs, 1)
- # 此处还可以传入其他层
- )
- print(net)
- print(net[0])
-
- #查看所有可学习参数
- for param in net.parameters():
- print(param)
-
- #初始化模型参数
- init.normal_(net[0].weight, mean=0, std=0.01) #将权重参数每个元素初始化为随机采样于均值为0、标准差为0.01的正态分布
- init.constant_(net[0].bias, val=0) # 也可以直接修改bias的data: net[0].bias.data.fill_(0)
- print(net[0].weight)
- print(net[0].bias)
-
- #定义损失函数
- loss = nn.MSELoss()
-
- #定义优化算法
- optimizer = optim.SGD(net.parameters(), lr=0.03)
-
- #调整学习率
- # optimizer.param_groups: 是长度为2的list,其中的元素是2个字典;
- # optimizer.param_groups[0]: 长度为6的字典,包括[‘amsgrad’, ‘params’, ‘lr’, ‘betas’, ‘weight_decay’, ‘eps’]这6个参数;
- # optimizer.param_groups[1]: 好像是表示优化器的状态的一个字典;
- optimizer.param_groups[0]['lr'] *= 0.1
-
- #训练模型
- num_epochs = 3
- for epoch in range(1, num_epochs + 1):
- for X, y in data_iter:
- output = net(X)
- #torch.view(-1, 参数b),则表示在参数a未知,参数b已知的情况下自动补齐行向量长度
- l = loss(output, y.view(-1, 1))
- optimizer.zero_grad() # 梯度清零,等价于net.zero_grad()
- l.backward()
- optimizer.step()#更新优化器参数
- print('epoch %d, loss: %f' % (epoch, l.item()))
- #w b 比较
- dense = net[0] #第零层网络
- print(true_w, dense.weight)
- print(true_b, dense.bias)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。