赞
踩
hessian matrix 可逆时
[
H
j
k
]
−
1
∇
f
(
x
)
[H_{jk}]^{-1}\nabla f(x)
[Hjk]−1∇f(x)hessian matrix
H
j
k
H_{jk}
Hjk是半正定矩阵[positive semi-definite]
或正定矩阵[positive definite]
可得为函数是一般凸函数
hessian matrix
H
j
k
H_{jk}
Hjk是正定矩阵[positive definite]
可得为函数是强凸函数
假设我们有一个实对称矩阵S和二次型函数表示如下:
S
=
[
1
0
0
b
]
,
f
(
x
)
=
1
2
x
T
S
x
=
1
2
(
x
2
+
b
y
2
)
假设我们有如下函数:
f
(
x
,
y
)
=
2
x
+
5
y
=
[
2
5
]
[
x
y
]
=
A
T
X
,
A
=
[
2
5
]
hessian matrix
如下:[向量对向量求导,XY拉伸术]
假设我们有一个函数表示如下:
f
(
x
)
=
1
2
x
T
S
x
−
a
T
x
−
b
hessian matrix
:对于线搜索方法来说,迭代公式如下,但是对于步长的选择来说,我们如果选择步长 s k s_k sk太大,那么就很容易越过极值点,在极值点不断跳跃和震荡,如果步长 s k s_k sk太小,那么迭代太慢,没有效果
那么我们希望找到一个步长
s
k
s_k
sk使得在搜索方向上使得
f
(
x
k
+
1
)
f(x_{k+1})
f(xk+1)最小,这样就不是固定步长了,相当于动态步长
s
k
∗
=
arg min
s
k
f
(
x
k
+
1
)
这里没弄懂,后续再研究,反推出来的
之字型
不断地趋近于最小,就像不同的椭圆进行等比缩小,最终求得最小值。Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。