当前位置:   article > 正文

Pytorch获取神经网络各层的参数名称及参数值_pytorch 打印网络参数

pytorch 打印网络参数
一、parameters()

model.parameters()可以返回model网络的可学习参数,具体代码如下:

import torch.nn as nn

# 定义网络
class Net(nn.Module):
  def __init__(self):
    # nn.Module的子类必须在构造函数中执行父类的构造函数
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(400, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

net = Net() # 创建网络
# print(net) # 打印网络

# 仅查看网络中的可学习参数(遍历)
for params in net.parameters():
    # print(params)
    # print(params.data) # 获取纯数据
    print(params.shape)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在这里插入图片描述

也可以通过下述方式进行获取:

import torch.nn as nn

class Net(nn.Module):
  def __init__(self):
    # nn.Module的子类必须在构造函数中执行父类的构造函数
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(400, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

net = Net() # 创建网络
# print(net) # 打印网络

# 仅查看网络中的可学习参数,list形式
params = list(net.parameters())
# print(params) # 各层的参数值
# print(params[-2])
# print(params[-2].data) # 获取纯数据(最后一个全连接层的权重)
print(params[-2].data.shape) # 最后一个全连接层的权重的形状
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在这里插入图片描述

二、named_parameters()

model.named_parameters()可同时返回model的可学习的参数及名称,具体代码如下:

import torch.nn as nn

# 定义网络
class Net(nn.Module):
  def __init__(self):
    # nn.Module的子类必须在构造函数中执行父类的构造函数
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(400, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

net = Net() # 创建网络
# print(net) # 打印网络

# 查看网络中的可学习参数及名称
for name,params in net.named_parameters():
    print(name)
    # print(params)
    # print(params.shape)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在这里插入图片描述

三、state_dict()

model.state_dict()常见于模型的保存,它返回的是一个字典,分别对应模型中的键和值。

import torch.nn as nn

class Net(nn.Module):
  def __init__(self):
    # nn.Module的子类必须在构造函数中执行父类的构造函数
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(400, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

net = Net() # 创建网络
# print(net) # 打印网络

# state_dict()存放训练过程中需要学习的权重和偏置
for k,v in net.state_dict().items(): # items()返回可遍历的(键, 值) 元组数组
    print(k)
    # print(v) # 纯数值
    # print(v.shape)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

在这里插入图片描述

四、children()

model.children()可以返回网络的各层(最外层)。

import torch.nn as nn

class Net(nn.Module):
  def __init__(self):
    # nn.Module的子类必须在构造函数中执行父类的构造函数
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(400, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

net = Net() # 创建网络
# print(net) # 打印网络

# net.children()遍历net的层(最wai层)
for x in net.children():
    print(x)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

在这里插入图片描述

五、一些总结

在复现顶会论文开源代码时,经常遇到上述几个函数,因此特将它们记录下来。为了便于结果展示,我注释了很多代码,建议大家把这些注释去掉,都实践一下,多多体会。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/717078
推荐阅读
相关标签
  

闽ICP备14008679号