赞
踩
神经网络通常依赖反向传播求梯度来更新网络参数,求梯度过程通常是一件非常复杂而容易出错的事情。
而深度学习框架可以帮助我们自动地完成这种求梯度运算。
Pytorch一般通过反向传播 backward 方法 实现这种求梯度计算。该方法求得的梯度将存在对应自变量张量的grad属性下。
除此之外,也能够调用torch.autograd.grad 函数来实现求梯度计算。
这就是Pytorch的自动微分机制。
backward 方法通常在一个标量张量上调用,该方法求得的梯度将存在对应自变量张量的grad属性下。
如果调用的张量非标量,则要传入一个和它同形状 的gradient参数张量。
相当于用该gradient参数张量与调用张量作向量点乘,得到的标量结果再反向传播。
1, 标量的反向传播
- import numpy as np
- import torch
-
- # f(x) = a*x**2 + b*x + c的导数
-
- x = torch.tensor(0.0,requires_grad = True) # x需要被求导
- a = torch.tensor(1.0)
- b = torch.tensor(-2.0)
- c = torch.tensor(1.0)
- y = a*torch.pow(x,2) + b*x + c
-
- y.backward()
- dy_dx = x.grad
- print(dy_dx)
tensor(-2.)
2, 非标量的反向传播
- import numpy as np
- import torch
-
- # f(x) = a*x**2 + b*x + c
-
- x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求导
- a = torch.tensor(1.0)
- b = torch.tensor(-2.0)
- c = torch.tensor(1.0)
- y = a*torch.pow(x,2) + b*x + c
-
- gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])
-
- print("x:\n",x)
- print("y:\n",y)
- y.backward(gradient = gradient)
- x_grad = x.grad
- print("x_grad:\n",x_grad)
二,利用autograd.grad方法求导数
- import numpy as np
- import torch
-
- # f(x) = a*x**2 + b*x + c的导数
-
- x = torch.tensor(0.0,requires_grad = True) # x需要被求导
- a = torch.tensor(1.0)
- b = torch.tensor(-2.0)
- c = torch.tensor(1.0)
- y = a*torch.pow(x,2) + b*x + c
-
-
- # create_graph 设置为 True 将允许创建更高阶的导数
- dy_dx = torch.autograd.grad(y,x,create_graph=True)[0]
- print(dy_dx.data)
-
- # 求二阶导数
- dy2_dx2 = torch.autograd.grad(dy_dx,x)[0]
-
- print(dy2_dx2.data)
tensor(-2.)
tensor(2.)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。