当前位置:   article > 正文

3. 机器学习中为什么需要梯度下降_机器学习 梯度到底是什么

机器学习为什么需要梯度下降

梯度,到底是什么?很容易混淆。

站在山底,哪个方向爬坡最快,这个容易想象,但问题是,如果所在的高度是我们优化的目标的话,这个爬坡的方向并不是梯度的方向,这个是我们的目标值(函数值)的变化趋势。

先看一下定义:

295ec9e33f5c720d53e56e2a3235ab7e.png

即:梯度是一个向量,而向量就有方向,该方向是方向导数取得最大值的方向,那方向导数是什么?

26f0b00226da4b1f4dbb4e135454cb40.png

可见:

  1. 方向导数是一个数
  2. 方向指的是函数定义域的内点变化的方向

综上,自变量沿着该方向变化,使函数值变化最大,机器学习中,函数值就是我们的优化目标。
当函数值是损失函数值的时候,我们期望的是最小值,这个时候取梯度的反方向,即梯度下降即可。
这就是为什么我们经常看到,理解梯度,先画等高线示意图的原因,投影到地面的等高线,其实就是自变量的定义域,也就是机器学习中的参数空间,我们需要知道,怎么更新参数,才能让损失函数值最快地减小。

5488b78827a7d97b12e843d975cf027f.png

好,那现在的问题是梯度到底是哪个方向?也就是,自变量到底沿哪个方向变化,函数值变化最快。
注意看右边的等高线,假设有一个点A,无限放大等高线:

5f940d3f27b5544db42688624edc77eb.png

如上图,也就是说,垂直于切线即法向量的方向,就是变化最快的方向,也就是梯度的方向。
法向量的定义如下:

e2d2182e0d4dd737cc04e6bbc91d057f.png

总结一下,梯度是个向量,自变量沿着该向量的方向变化,函数值变化最快。
在机器学习中,为使损失函数下降最快,我们需要让模型参数沿着梯度的负方向更新,即梯度下降

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/104192?site
推荐阅读
相关标签
  

闽ICP备14008679号