当前位置:   article > 正文

【深度学习】PyTorch搭建基础神经网络(超详细)_pytorch搭建一个简单的神经网络

pytorch搭建一个简单的神经网络

引言:

神经网络作为人工智能的重要组成部分,在图像处理、自然语言处理、语音识别、机器翻译等领域具有广泛的应用。本文将详细介绍如何搭建简单的神经网络框架并进行训练。在搭建神经网络前,对数据集的下载和处理的详细可以看我的这篇博客:(神经网络模型(最细的手写字识别案例)_AI_dataloads的博客-CSDN博客

代码展示:

首先定义一个名为NeuralNetwork的类,它继承了PyTorch框架的nn.Module类,用于创建神经网络。 接下来部分是类的构造函数__init__(),用于初始化神经网络的各个层。在这个类中,初始化了以下层:

  • flatten:一个将输入展平的层。
  • hidden1:第一个隐藏层,输入大小为28x28(图像大小),输出大小为128。
  • hidden2:第二个隐藏层,输入大小为128,输出大小为128。
  • hidden3:第三个隐藏层,输入大小为128,输出大小为64。
  • out:输出层,输入大小为64,输出大小为10(类别数)。
  1. # 定义一个名为NeuralNetwork的类,它继承了PyTorch框架的nn.Module类,用于创建神经网络。
  2. class NeuralNetwork(nn.Module):
  3. def __init__(self):
  4. # 继承父类nn.Module的方法和属性
  5. super(NeuralNetwork, self).__init__()
  6. # 数据进行展平操作
  7. self.flatten=nn.Flatten()
  8. # 定义一层线性神经网络
  9. self.hidden1=nn.Linear(28*28,128)
  10. self.hidden2=nn.Linear(128,128)
  11. self.hidden3=nn.Linear(128,64)
  12. self.out=nn.Linear(64,10)

这部分定义了前向传播方法forward(),通过前向传播计算输入数据x的输出。首先输入的数据先通过flatten层展平,然后依次经过隐藏层和激活函数进行线性变换和非线性处理。最后经过输出层输出预测结果x。(注意这个函数也是定义在NeuralNetwork之中的。)

  1. def forward(self,x):
  2. # 对输入数据进行展平操作
  3. x=self.flatten(x)
  4. # 将数据传入第一层线性神经网络
  5. x=self.hidden1(x)
  6. # 对神经网络的输出应用ReLU激活函数
  7. x=torch.relu(x)
  8. x=self.hidden2(x)
  9. # 对神经网络的输出应用sigmoid激活函数
  10. x=torch.sigmoid(x)
  11. x=self.hidden3(x)
  12. x=torch.relu(x)
  13. # 将数据传入输出层
  14. x=self.out(x)
  15. # 最后经过输出层输出预测结果x
  16. return x
'
运行

这行代码创建了一个model的神经网络模型实例,并将其移动到特定的设备(我这里使用的是GPU)上进行计算。如何查看自己的torch设备(device)可以查看这篇博客:神经网络模型(最细的手写字识别案例)_AI_dataloads的博客-CSDN博客

model=NeuralNetwork().to(device)

这行代码创建了一个CrossEntropyLoss(交叉熵损失函数的实例,用作损失函数。想要了解神经网络中的损失函数可以看我的这篇博客:pytorch中损失函数的使用_AI_dataloads的博客-CSDN博客

  1. #交叉熵损失函数
  2. loss_fn=nn.CrossEntropyLoss()

这行代码创建了一个Adam优化器的实例,将模型参数和学习率作为参数传入。想了解优化器的定义可以参考我的这篇博客:pytorch中损失函数的使用_AI_dataloads的博客-CSDN博客

  1. # model.parameters()用于获取模型的所有参数。这些参数包括权重和偏差等
  2. # 它们都是Tensor类型的,是神经网络的重要组成部分
  3. optimizer=torch.optim.Adam(model.parameters(),lr=0.005)

这行代码定义了一个名为train的函数,用于进行训练。函数接受训练数据、模型、损失函数和优化器作为输入参数。

  1. '''定义训练函数'''
  2. def train(dataloader,model,loss_fn,optimizer):
  3. # 设置模型为训练模式
  4. model.train()
  5. # 记录优化次数
  6. num=1
  7. # 遍历数据加载器中的每一个数据批次。
  8. for X,y in dataloader:
  9. X,y=X.to(device),y.to(device)
  10. # 自动初始化权值w
  11. pred=model.forward(X)
  12. loss=loss_fn(pred,y) # 计算损失值
  13. # 将优化器的梯度缓存清零
  14. optimizer.zero_grad()
  15. # 执行反向传播计算梯度
  16. loss.backward()
  17. # 并通过优化器更新模型参数
  18. optimizer.step()
  19. # 将损失值转换为标量
  20. loss_value=loss.item()
  21. #将此次损失值打印出来
  22. print(f'loss:{loss_value},[numbes]:{num}')
  23. #增加计数器num
  24. num+=1
'
运行

这行代码调用train函数来开始模型的训练。它传入训练数据、模型、损失函数和优化器,并执行训练过程。(注意训练前要先获取dataloader,详细可以参考我的博客:PyTorch DataLoader详解:如何高效加载和处理大规模数据集?_AI_dataloads的博客-CSDN博客

  1. #调用函数train(),传入训练数据,神经网络模型,损失函数和优化算法
  2. train(train_dataloader,model,loss_fn,optimizer)

下面是运行后的结果:可以看出一共进行了938次,并展示了每一次的损失值

下面是完整代码展示:

  1. '''定义神经网络'''
  2. class NeuralNetwork(nn.Module):
  3. def __init__(self):
  4. super(NeuralNetwork, self).__init__()
  5. self.flatten=nn.Flatten()
  6. self.hidden1=nn.Linear(28*28,128)
  7. self.hidden2=nn.Linear(128,128)
  8. self.hidden3=nn.Linear(128,64)
  9. self.out=nn.Linear(64,10)
  10. def forward(self,x):
  11. x=self.flatten(x)
  12. x=self.hidden1(x)
  13. x=torch.relu(x)
  14. x=self.hidden2(x)
  15. x=torch.sigmoid(x)
  16. x=self.hidden3(x)
  17. x=torch.relu(x)
  18. x=self.out(x)
  19. return x
  20. model=NeuralNetwork().to(device)
  21. print(model)
  22. '''建立损失函数和优化算法'''
  23. #交叉熵损失函数
  24. loss_fn=nn.CrossEntropyLoss()
  25. # 优化算法为随机梯度算法/Adam优化算法
  26. optimizer=torch.optim.Adam(model.parameters(),lr=0.005)
  27. '''定义训练函数'''
  28. def train(dataloader,model,loss_fn,optimizer):
  29. model.train()
  30. # 记录优化次数
  31. num=1
  32. for X,y in dataloader:
  33. X,y=X.to(device),y.to(device)
  34. # 自动初始化权值w
  35. pred=model.forward(X)
  36. loss=loss_fn(pred,y) # 计算损失值
  37. optimizer.zero_grad()
  38. loss.backward()
  39. optimizer.step()
  40. loss_value=loss.item()
  41. print(f'loss:{loss_value},[numbes]:{num}')
  42. num+=1
  43. train(train_dataloader,model,loss_fn,optimizer)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/816664
推荐阅读
相关标签
  

闽ICP备14008679号