当前位置:   article > 正文

速成pytorch学习——3天自动微分机制_pytorch入门-三天速成

pytorch入门-三天速成

神经网络通常依赖反向传播求梯度来更新网络参数,求梯度过程通常是一件非常复杂而容易出错的事情。

深度学习框架可以帮助我们自动地完成这种求梯度运算。

Pytorch一般通过反向传播 backward 方法 实现这种求梯度计算。该方法求得的梯度将存在对应自变量张量的grad属性下。

除此之外,也能够调用torch.autograd.grad 函数来实现求梯度计算。

这就是Pytorch的自动微分机制。

一,利用backward方法求导数

backward 方法通常在一个标量张量上调用,该方法求得的梯度将存在对应自变量张量的grad属性下。

如果调用的张量非标量,则要传入一个和它同形状 的gradient参数张量。

相当于用该gradient参数张量与调用张量作向量点乘,得到的标量结果再反向传播

1, 标量的反向传播

  1. import numpy as np
  2. import torch
  3. # f(x) = a*x**2 + b*x + c的导数
  4. x = torch.tensor(0.0,requires_grad = True) # x需要被求导
  5. a = torch.tensor(1.0)
  6. b = torch.tensor(-2.0)
  7. c = torch.tensor(1.0)
  8. y = a*torch.pow(x,2) + b*x + c
  9. y.backward()
  10. dy_dx = x.grad
  11. print(dy_dx)
tensor(-2.)

2, 非标量的反向传播

  1. import numpy as np
  2. import torch
  3. # f(x) = a*x**2 + b*x + c
  4. x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求导
  5. a = torch.tensor(1.0)
  6. b = torch.tensor(-2.0)
  7. c = torch.tensor(1.0)
  8. y = a*torch.pow(x,2) + b*x + c
  9. gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])
  10. print("x:\n",x)
  11. print("y:\n",y)
  12. y.backward(gradient = gradient)
  13. x_grad = x.grad
  14. print("x_grad:\n",x_grad)

二,利用autograd.grad方法求导数

  1. import numpy as np
  2. import torch
  3. # f(x) = a*x**2 + b*x + c的导数
  4. x = torch.tensor(0.0,requires_grad = True) # x需要被求导
  5. a = torch.tensor(1.0)
  6. b = torch.tensor(-2.0)
  7. c = torch.tensor(1.0)
  8. y = a*torch.pow(x,2) + b*x + c
  9. # create_graph 设置为 True 将允许创建更高阶的导数
  10. dy_dx = torch.autograd.grad(y,x,create_graph=True)[0]
  11. print(dy_dx.data)
  12. # 求二阶导数
  13. dy2_dx2 = torch.autograd.grad(dy_dx,x)[0]
  14. print(dy2_dx2.data)

 

tensor(-2.)

tensor(2.)

 

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号