当前位置:   article > 正文

PyTorch中两种模型构造方式区别分析-普通前向传递与nn.Sequential()_模型结构和forward不同

模型结构和forward不同

PyTorch代码中存在两种常用的模型构造方式

1.普通方法——在构造函数中定义模型不同的层,在forward函数中输入的X依据指定的顺序进行前向传递

  1. import torch
  2. import torch.nn as nn
  3. class Net(nn.Module):
  4. def __init__(self, n_feature, n_hidden, n_output):
  5. super(Net, self).__init__()
  6. self.hidden = nn.Linear(n_feature, n_hidden)
  7. self.predict = nn.Linear(n_hidden, n_output)
  8. def forward(self, x):
  9. x = F.relu(self.hidden(x)) # hidden后接relu层
  10. x = self.predict(x)
  11. return x
  12. model_1 = Net(1, 10, 1)
  13. print(model_1)
  14. '''运行结果为:
  15. Net(
  16. (hidden): Linear(in_features=1, out_features=10, bias=True)
  17. (predict): Linear(in_features=10, out_features=1, bias=True)
  18. )
  19. '''

2.使用nn.Sequential按顺序构造所有层,在forward函数中直接调用

nn.Sequential的特点:将容器视为单个模块,即一个模块可以包含许多层

nn.Sequential有三种常见定义模型的方式:

① 基本实现方式:顺序定义每一层,特点:每一层没有名字,仅能通过下标访问各层

  1. import torch
  2. import torch.nn as nn
  3. class Net(nn.Module):
  4. def __init__(self, n_feature, n_hidden, n_output):
  5. super(Net,self).__init__()
  6. self.net_1 = nn.Sequential(
  7. nn.Linear(n_feature, n_hidden),
  8. nn.ReLU(),
  9. nn.Linear(n_hidden, n_output)
  10. )
  11. def forward(self,x):
  12. x = self.net_1(x)
  13. return x
  14. model_2 = Net(1,10,1)
  15. print(model_2)
  16. '''运行结果为:
  17. Net(
  18. (net_1): Sequential(
  19. (0): Linear(in_features=1, out_features=10, bias=True)
  20. (1): ReLU()
  21. (2): Linear(in_features=10, out_features=1, bias=True)
  22. )
  23. )
  24. '''

② 给每一层自定义名称

  1. import torch.nn as nn
  2. from collections import OrderedDict
  3. model = nn.Sequential(OrderedDict([
  4. ('conv1', nn.Conv2d(1, 20, 5)),
  5. ('relu1', nn.ReLU()),
  6. ('conv2', nn.Conv2d(20, 64, 5)),
  7. ('relu2', nn.ReLU())
  8. ]))
  9. print(model)
  10. print(model[2]) # 通过索引获取第几个层
  11. print(model.conv1)
  12. '''运行结果为:
  13. Sequential(
  14. (conv1): Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  15. (relu1): ReLU()
  16. (conv2): Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  17. (relu2): ReLU()
  18. )
  19. Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  20. Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  21. '''

③ 使用add_module方法逐层加入Sequential中,该方法是从nn.Module类继承而来,nn.Sequental本身没有该方法,可通过自定义名称访问。

  1. 1 import torch.nn as nn
  2. 2 from collections import OrderedDict
  3. 3
  4. 4 model = nn.Sequential()
  5. 5 model.add_module("conv1", nn.Conv2d(1, 20, 5))
  6. 6 model.add_module('relu1', nn.ReLU())
  7. 7 model.add_module('conv2', nn.Conv2d(20, 64, 5))
  8. 8 model.add_module('relu2', nn.ReLU())
  9. 9
  10. 10 print(model)
  11. 11 print(model[2]) # 通过索引获取第几个层
  12. 12 print(model.conv1)
  13. 13 '''运行结果为:
  14. 14 Sequential(
  15. 15 (conv1): Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  16. 16 (relu1): ReLU()
  17. 17 (conv2): Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  18. 18 (relu2): ReLU()
  19. 19 )
  20. 20 Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  21. 21 Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  22. 22 '''

通过观察两种不同的模型构造方式,可以发现以下区别:

① nn.Sequential在模型定义和前向传递过程中,定义的层只需出现一次,可以简化代码

② 普通模型构造方法需要多个函数嵌套,在模型较大,层数较多时会非常混乱,容易出错

③ nn.Sequential是将内部各模块按顺序排列的,因此不适合实现特殊结构,比如ResNet就无法使用nn.Sequential完整表示出来(这是普通方法构造模型的必然性)

④ 较小的模型可以使用nn.Sequential或者普通方法构造模型,较大的模型可以使用nn.Sequential方法,比较复杂的模型可以结合两者优点,来达到既简化模型,又灵活实现的目的。

参考资料 :



(45条消息) nn.Sequential方法介绍_Raywit的博客-CSDN博客_nn.sequential

1、nn.Sequential类-使用Sequential类来自定义顺序连接模型 - 小吴的日常 - 博客园 (cnblogs.com)

最后:

受作者水平限制,文章可能有内容描述不够准确恰当,欢迎在评论中指出,文章将持续更新

谢谢!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/653134
推荐阅读
相关标签
  

闽ICP备14008679号