赞
踩
model.parameters()可以返回model网络的可学习参数,具体代码如下:
import torch.nn as nn # 定义网络 class Net(nn.Module): def __init__(self): # nn.Module的子类必须在构造函数中执行父类的构造函数 super(Net, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核 self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(400, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) net = Net() # 创建网络 # print(net) # 打印网络 # 仅查看网络中的可学习参数(遍历) for params in net.parameters(): # print(params) # print(params.data) # 获取纯数据 print(params.shape)
也可以通过下述方式进行获取:
import torch.nn as nn class Net(nn.Module): def __init__(self): # nn.Module的子类必须在构造函数中执行父类的构造函数 super(Net, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核 self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(400, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) net = Net() # 创建网络 # print(net) # 打印网络 # 仅查看网络中的可学习参数,list形式 params = list(net.parameters()) # print(params) # 各层的参数值 # print(params[-2]) # print(params[-2].data) # 获取纯数据(最后一个全连接层的权重) print(params[-2].data.shape) # 最后一个全连接层的权重的形状
model.named_parameters()可同时返回model的可学习的参数及名称,具体代码如下:
import torch.nn as nn # 定义网络 class Net(nn.Module): def __init__(self): # nn.Module的子类必须在构造函数中执行父类的构造函数 super(Net, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核 self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(400, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) net = Net() # 创建网络 # print(net) # 打印网络 # 查看网络中的可学习参数及名称 for name,params in net.named_parameters(): print(name) # print(params) # print(params.shape)
model.state_dict()常见于模型的保存,它返回的是一个字典,分别对应模型中的键和值。
import torch.nn as nn class Net(nn.Module): def __init__(self): # nn.Module的子类必须在构造函数中执行父类的构造函数 super(Net, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核 self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(400, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) net = Net() # 创建网络 # print(net) # 打印网络 # state_dict()存放训练过程中需要学习的权重和偏置 for k,v in net.state_dict().items(): # items()返回可遍历的(键, 值) 元组数组 print(k) # print(v) # 纯数值 # print(v.shape)
model.children()可以返回网络的各层(最外层)。
import torch.nn as nn class Net(nn.Module): def __init__(self): # nn.Module的子类必须在构造函数中执行父类的构造函数 super(Net, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) # 依次为输入通道、输出通道和卷积核 self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(400, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) net = Net() # 创建网络 # print(net) # 打印网络 # net.children()遍历net的层(最wai层) for x in net.children(): print(x)
在复现顶会论文开源代码时,经常遇到上述几个函数,因此特将它们记录下来。为了便于结果展示,我注释了很多代码,建议大家把这些注释去掉,都实践一下,多多体会。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。