关于对偶问题的动机说完了,下面我们把注意力集中在
m
i
n
f
(
x
)
min f(x)
minf(x)上,然后有两条约束条件,其实约束条件相当于将解空间划分为了两块,
空
间
1
空间1
空间1是符合约束条件,
空
间
2
空间2
空间2是不符合约束条件。
下面我们重新搬出拉格朗日乘数法的公式,再仔细观察一下这个原始问题与拉格朗日乘数法的关系。
我们试着来求一下
m
i
n
x
m
a
x
α
,
β
L
(
x
,
α
,
β
)
min_{x} max_{α,β} L(x,α,β)
minxmaxα,βL(x,α,β)。(有人可能有疑问,好端端的,为何突然要求这个,这是因为有人想试图使用对偶问题来转化并解决原始问题并且成功了。) 空间1:此时符合约束条件,所以
h
(
x
)
=
0
h(x)=0
h(x)=0,且
g
(
x
)
=
0
时
β
>
0
,
g
(
x
)
<
0
时
β
=
0
g(x)=0时β>0,g(x)<0时β=0
g(x)=0时β>0,g(x)<0时β=0,故
α
h
(
x
)
+
β
g
(
x
)
=
0
αh(x)+βg(x)=0
αh(x)+βg(x)=0,所以
m
a
x
α
,
β
L
(
x
,
α
,
β
)
=
f
(
x
)
+
0
=
f
(
x
)
max_{α,β} L(x,α,β)=f(x)+0=f(x)
maxα,βL(x,α,β)=f(x)+0=f(x),所以
m
i
n
x
m
a
x
α
,
β
L
(
x
,
α
,
β
)
=
m
i
n
x
f
(
x
)
min_{x} max_{α,β} L(x,α,β)=min_{x} f(x)
minxmaxα,βL(x,α,β)=minxf(x)。 空间2:此时不符合约束条件,则
m
a
x
α
,
β
L
(
x
,
α
,
β
)
=
∞
max_{α,β} L(x,α,β)=∞
maxα,βL(x,α,β)=∞
所以,在符合约束的情况下,原始的
m
i
n
x
f
(
x
)
min_{x} f(x)
minxf(x)问题就等价于
m
i
n
x
m
a
x
α
,
β
L
(
x
,
α
,
β
)
min_{x} max_{α,β} L(x,α,β)
minxmaxα,βL(x,α,β)
这是第一阶段的工作,就是得出结论,原始的问题转化为新的问题,称为primal最小化问题。
对偶问题
下面注意哈,我们要定义一个对偶问题:
m
a
x
α
,
β
m
i
n
x
L
(
x
,
α
,
β
)
max_{α,β} min_{x} L(x,α,β)
maxα,βminxL(x,α,β) 注意哈,此处我们的max和min的位置变换了(包含变量也要变换),我们把原问题的max和min对换了。我们下面的任务就是,证明上面的对偶问题(称为dual问题))和上一阶段得到的primal问题是等价的。
明白了使用对偶的动机,现在我们来看这个dual问题的公式与primal问题的公式的大小关系:
m
a
x
α
,
β
m
i
n
x
L
(
x
,
α
,
β
)
<
=
m
i
n
x
m
a
x
α
,
β
L
(
x
,
α
,
β
)
(
式
0
)
max_{α,β} min_{x} L(x,α,β)<=min_{x} max_{α,β} L(x,α,β)(式0)
maxα,βminxL(x,α,β)<=minxmaxα,βL(x,α,β)(式0) 上式为什么成立呢?因为首先对于左式中任意的
α
和
β
α和β
α和β,一定有
m
i
n
x
L
(
x
,
α
,
β
)
<
=
m
i
n
x
m
a
x
α
,
β
L
(
x
,
α
,
β
)
(
式
1
)
min_{x} L(x,α,β)<=min_{x} max_{α,β} L(x,α,β) (式1)
minxL(x,α,β)<=minxmaxα,βL(x,α,β)(式1) 没问题吧,你想啊,右式首先对于
α
和
β
α和β
α和β取了最大值,而左式是任意值,在这个基础上,左式和右式对于
x
x
x同时取最小值,自然是右式>=左式啊,所以(式1)是成立的吧,需要注意的是,右式此时已经是一个实数了,而左式还是关于
α
和
β
α和β
α和β的函数,上式的成立已经意味着你这个函数<=右式的实数了,那么你再对左式求最大值岂不是一定<=右式的实数?所以最终(式0)成立。这就是所谓的 “极小的极大 ⩽ 极大的极小”。