人工智能uu

这个屌丝很懒，什么也没留下！

热门标签

协方差矩阵—Hessian矩阵—正定矩阵

作者：人工智能uu | 2024-06-19 06:52:07

踩

hessian矩阵

文章目录

- - 一、基本概念

一、基本概念

1.1 协方差矩阵及推导

在统计学中用标准差描述样本数据的 “散布度” 公式中之所以除以 n-1 而不是 n,
是因为这样使我们以较少的样本集更好的逼近总体标准差。即统计学上所谓的 “无偏估计”。
关于 协方差 与散度：https://blog.csdn.net/wsp_1138886114/article/details/80967843

方差： $\frac{\sum_{i=1}^n(X_i-\bar{X})(X_i-\bar{X})}{n-1}$

各个维度偏离其均值的程度，协方差： $\text{cov}(X,Y) = \frac{\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}$

协方差矩阵的计算：
这里写图片描述

(\begin{matrix} 1 & 2 & 3 & 4 \\ 3 & 4 & 1 & 2 \\ 2 & 3 & 1 & 4 \end{matrix})

$\begin{pmatrix} 1 & 2 &3 &4 \\ 3&4 &1 & 2\\ 2& 3& 1& 4 \end{pmatrix}$ j

c o v (z) = ⎝ ⎛ 132243311424 ⎠ ⎞ j

1.2 Hessian矩阵

Hessian矩阵定义：
若一元函数 $f (x)$ 在 $x = x^{(0)}$ 点的某个领域内具有任意阶导数，则 $f (x)$ 在 $x^{(0)}$ 点的泰勒展开式为：
$f(x^{(0)}) + f'(x^{(0)})\Delta x + \frac{1}{2} f''(x^{(0)})(\Delta x^2)+\cdots \tag{1}$

其中： $\Delta x = x-x^{(0)},\Delta x^2 = (x-x^{(0)})^2$

二元函数 $f(x_1,x_2)$ 在 $X^{(0)}(x^{(0)}_1,x^{(0)}_2)$ 点处的泰勒展开式为：
$\frac{1}{2}\left [ \frac{\partial^2f}{\partial^2x_1^2}|_{x^{(0)}} \Delta x_1^2 + 2\frac{\partial^2f}{\partial x_1\partial x_2}|_{x^{(0)}}\Delta x_1\Delta x_2+\frac{\partial^2f}{\partial^2x_2^2}|_{x^{(0)}} \Delta x_2^2\right ]+\cdots \tag{2}$

其中： $\Delta x_1 = x_1-x^{(0)}_1,\Delta x_2 = x_2-x_2^{(0)}$

将上述(2)展开式写成矩阵形式，则有：
$f(X^{(0)})+\left ( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2} \right )_{x^{(0)}}$

(\begin{matrix} Δ x_{1} \\ Δ x_{2} \end{matrix})

$\begin{pmatrix} \Delta x_1\\ \Delta x_2 \end{pmatrix}$ +\frac{1}{2}(\Delta x_1,\Delta x_2)

{\begin{matrix} \frac{\partial^{2} f}{\partial x_{1}^{2}} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} \\ \frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^{2}} \end{matrix}}

$\begin{Bmatrix} \frac{\partial^2f}{\partial x_1^2} & \frac{\partial^2f}{\partial x_1 \partial x_2}\\ \frac{\partial^2f}{\partial x_2 \partial x_1}& \frac{\partial^2f}{\partial x_2^2} \end{Bmatrix}$ |_{x^{(0)}}

(\begin{matrix} Δ x_{1} \\ Δ x_{2} \end{matrix})

$\begin{pmatrix} \Delta x_1\\ \Delta x_2 \end{pmatrix}$ +\cdots \tag{3}

f (X) = f (X^{(0)}) + (\frac{\partial f}{\partial x _{1}}, \frac{\partial f}{\partial x _{2}})_{x^{(0)}} (Δ x_{1} Δ x_{2}) + \frac{1}{2} (Δ x_{1}, Δ x_{2}) {\frac{\partial ^{2} f}{\partial x _{1}^{2}} \frac{\partial ^{2} f}{\partial x _{2} \partial x _{1}} \frac{\partial ^{2} f}{\partial x _{1} \partial x _{2}} \frac{\partial ^{2} f}{\partial x _{2}^{2}}} ∣_{x^{(0)}} (Δ x_{1} Δ x_{2}) + \dots (3)

即为：
$f(X^{(0)})+\nabla f(X^{(0)})^T + \frac{1}{2} \Delta x^T G(X^{(0)}) \Delta X +\cdots \tag{4}$

其中：
$G(X^{(0)}) =$

{\begin{matrix} \frac{\partial^{2} f}{\partial x_{1}^{2}} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} \\ \frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^{2}} \end{matrix}}

(\begin{matrix} Δ x_{1} \\ Δ x_{2} \end{matrix})

$\begin{pmatrix} \Delta x_1\\ \Delta x_2 \end{pmatrix}$

G (X^{(0)}) = {\frac{\partial ^{2} f}{\partial x _{1}^{2}} \frac{\partial ^{2} f}{\partial x _{2} \partial x _{1}} \frac{\partial ^{2} f}{\partial x _{1} \partial x _{2}} \frac{\partial ^{2} f}{\partial x _{2}^{2}}} ∣_{x^{(0)}}, Δ X = (Δ x_{1} Δ x_{2})

$G(X^{(0)})$ 是 $f(x_1,x_2)$ 在 $X^{(0)}$ 点处的Hessian矩阵。它是由函数 $f(x_1,x_2)$ 在 $X^{(0)}$ 点处的二阶偏导数所组成的方阵。我们一般将其表示为:

[\begin{matrix} \frac{\partial^{2} f}{\partial x_{1}^{2}} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \dots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\ \frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^{2}} & \dots & \frac{\partial^{2} f}{\partial x_{2} \partial x_{n}} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ \frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{n} \partial x_{2}} & \dots & \frac{\partial^{2} f}{\partial x_{n}^{2}} \end{matrix}]

$\begin{bmatrix} \frac{\partial^2f}{\partial x_1^2} & \frac{\partial^2f}{\partial x_1 \partial x_2} & \cdots & \frac{\partial^2f}{\partial x_1 \partial x_n} \\ \frac{\partial^2f}{\partial x_2 \partial x_1} & \frac{\partial^2f}{\partial x_2^2} & \cdots & \frac{\partial^2f}{\partial x_2 \partial x_n}\\ \vdots & \vdots & \ddots &\vdots \\ \frac{\partial^2f}{\partial x_n \partial x_1} & \frac{\partial^2f}{\partial x_n \partial x_2} & \cdots & \frac{\partial^2f}{\partial x_n^2} \end{bmatrix}$

H (f) = ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎡ \frac{\partial ^{2} f}{\partial x _{1}^{2}} \frac{\partial ^{2} f}{\partial x _{2} \partial x _{1}} ⋮ \frac{\partial ^{2} f}{\partial x _{n} \partial x _{1}} \frac{\partial ^{2} f}{\partial x _{1} \partial x _{2}} \frac{\partial ^{2} f}{\partial x _{2}^{2}} ⋮ \frac{\partial ^{2} f}{\partial x _{n} \partial x _{2}} \dots \dots ⋱ \dots \frac{\partial ^{2} f}{\partial x _{1} \partial x _{n}} \frac{\partial ^{2} f}{\partial x _{2} \partial x _{n}} ⋮ \frac{\partial ^{2} f}{\partial x _{n}^{2}} ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎤

简写成： $\mathbf{Q_{Hessian}} =$

[\begin{matrix} I_{x x} & I_{x y} \\ I_{y x} & I_{y y} \end{matrix}]

$\begin{bmatrix} I_{xx} & I_{xy}\\ I_{yx} & I_{yy} \end{bmatrix}$

Q_{H e s s i a n} = [I_{x x} I_{y x} I_{x y} I_{y y}]

1.3 Hessian矩阵示例

这里写图片描述

1.3 正定矩阵定义及性质

在线性代数中，正定矩阵（positive definite matrix）简称正定阵。
定义：A是n阶方阵，如果对于任何非零向量x都有 $x^TAx>0$ 就称A正定矩阵。
这里写图片描述

1.4 正定矩阵示例

这里写图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/人工智能uu/article/detail/735667