赞
踩
实际工作中大量的决策问题,如计算广告中的部分机制策略问题、物流行业的路径规划问题甚至机器学习中的优化问题,都可以表示为数学优化问题,或者数学优化问题的变化形式如多目标优化问题。因此,接下来一段时间将会持续更新数学优化中的凸优化问题和整数规划问题相关知识总结
本篇是《凸优化读书笔记》系列的第二篇,主要讲述凸集相关的基本概念以及几种常见的凸集类型
零空间:在数学中,一个算子
A
A
A的零空间是方程
A
v
=
0
Av=0
Av=0所有解
v
v
v的集合,也叫做
A
A
A的核空间
仿射集合:如果
C
C
C是一个仿射集合,那它满足:如果
x
1
,
.
.
.
,
x
k
∈
C
x_{1},...,x_{k} \in C
x1,...,xk∈C且
θ
1
+
θ
2
+
.
.
.
+
θ
k
=
1
\theta_{1}+\theta_{2}+...+\theta_{k}=1
θ1+θ2+...+θk=1,那么
θ
1
x
1
+
.
.
.
+
θ
k
x
k
\theta_{1}x_{1}+...+\theta_{k}x_{k}
θ1x1+...+θkxk仍然在集合
C
C
C中
子空间:如果
C
C
C是一个仿射集合且
x
0
∈
C
x_{0} \in C
x0∈C,那么集合
V
=
C
−
x
0
=
{
x
−
x
0
∣
x
∈
C
}
V=C-x_{0}=\{x-x_{0}|x \in C\}
V=C−x0={x−x0∣x∈C}是一个子空间
仿射包:集合
C
C
C中的点的所有仿射组合组成的集合称作
C
C
C的仿射包,记为aff C。仿射包是包含
C
C
C的最小仿射集合
线性方程组的解集 C = { x ∣ A x = b } C=\{x|Ax=b\} C={x∣Ax=b}是一个仿射集合,这个结论很容易证明。设 x 1 , x 2 ∈ C x_{1},x_{2} \in C x1,x2∈C,即 A x 1 = b , A x 2 = b Ax_{1}=b,Ax_{2}=b Ax1=b,Ax2=b。对于任意 θ \theta θ有:
A
(
θ
x
1
+
(
1
−
θ
)
x
2
)
=
θ
A
x
1
+
(
1
−
θ
)
A
x
2
=
θ
b
+
(
1
−
θ
)
b
=
b
这说明任意的仿射组合
θ
x
1
+
(
1
−
θ
)
x
2
\theta x_{1}+(1-\theta)x_{2}
θx1+(1−θ)x2也在集合
C
C
C中,且与仿射集合
C
C
C相关联的子空间就是
A
A
A的零空间
反之任意仿射组合都可以表示为一个线性方程组的解集
仿射维数:集合
C
C
C的仿射维数是其仿射包的维数。举个例子说明,
R
2
R^{2}
R2上的单位圆环
{
x
∈
R
2
∣
x
1
2
+
x
2
2
=
1
}
\{x \in R^{2}|x_{1}^{2}+x_{2}^{2}=1\}
{x∈R2∣x12+x22=1},它的仿射包是全空间
R
2
R^{2}
R2,所以其仿射维数是2
闭包:当一个集合 S 在某个运算下不闭合的时候,我们通常可以找到包含 S 的最小的闭合集合。这个最小闭合集合被称为 S 的(关于这个运算的)闭包
相对内部:集合
C
C
C的相对内部定义如下:
r e l i n t C = { x ∈ C ∣ B ( x , r ) ∩ a f f C } relint {\,} C=\{x \in C|B(x,r) \cap aff {\,} C\} relintC={x∈C∣B(x,r)∩affC}
其中
B
(
x
,
r
)
=
{
y
∣
∣
∣
y
−
x
∣
∣
≤
r
}
B(x,r)=\{y|{\,}||y-x|| \leq r\}
B(x,r)={y∣∣∣y−x∣∣≤r},即半径为r,中心为x并有范数
∣
∣
.
∣
∣
||.||
∣∣.∣∣定义的球
相对边界:集合
C
C
C的相对边界为
c
l
C
/
r
e
l
i
n
t
C
cl{\,}C / relint{\,}C
clC/relintC,其中
c
l
C
cl{\,}C
clC是集合C的闭包
考虑 R 3 R^{3} R3中处于 ( x 1 , x 2 ) (x_{1},x_{2}) (x1,x2)平面的一个正方形,即:
C = { x ∈ R 3 ∣ − 1 ≤ x 1 ≤ 1 , − 1 ≤ x 2 ≤ 1 , x 3 = 0 } C=\{x \in R^{3}|-1 \leq x_{1} \leq 1,-1 \leq x_{2} \leq 1, x_{3=0}\} C={x∈R3∣−1≤x1≤1,−1≤x2≤1,x3=0}
其仿射包为 ( x 1 , x 2 ) (x_{1},x_{2}) (x1,x2)所在平面,相对内部为:
r e l i n t C = { x ∈ R 3 ∣ − 1 ≤ x 1 ≤ 1 , − 1 ≤ x 2 ≤ 1 , x 3 = 0 } relint{\,}C=\{x \in R^{3}|-1 \leq x_{1} \leq 1,-1 \leq x_{2} \leq 1, x_{3=0}\} relintC={x∈R3∣−1≤x1≤1,−1≤x2≤1,x3=0}
C C C的边界是其自身,相对边界是其边框:
{ x ∈ R 3 ∣ m a x { ∣ x 1 , ∣ x 2 ∣ } = 1 , x 3 = 0 } \{x \in R^{3}|max\{|x_{1},|x_{2}|\}=1,x_{3=0}\} {x∈R3∣max{∣x1,∣x2∣}=1,x3=0}
凸集:如果 C C C中任意两点间的线段仍然在 C C C中,即对于任意 x 1 , x 2 ∈ C x_{1},x_{2}\in C x1,x2∈C和 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0≤θ≤1有:
θ x 1 + ( 1 − θ ) x 2 ∈ C \theta x_{1} + (1-\theta)x_{2} \in C θx1+(1−θ)x2∈C
那么
C
C
C就是凸集
凸组合:点
θ
1
x
1
+
.
.
.
+
θ
k
x
k
\theta_{1}x_{1}+...+\theta_{k}x_{k}
θ1x1+...+θkxk为点
x
1
,
.
.
.
,
x
k
x_{1},...,x_{k}
x1,...,xk的一个凸组合,其中
θ
1
+
.
.
.
+
θ
k
=
1
\theta_{1}+...+\theta_{k}=1
θ1+...+θk=1。一个集合是凸集等价于集合包含其中所有点的凸组合
凸包:集合
C
C
C中所有凸组合的集合为其凸包:
c o n v C = { θ 1 x 1 + . . . + θ k x k ∣ x i ∈ C , θ i > 0 , i = 1 , . . . , k , θ 1 + . . . + θ k = 1 } conv{\,}C=\{\theta_{1}x_{1}+...+\theta_{k}x_{k}|x_{i}\in C,\theta_{i}>0,i=1,...,k,\theta_{1}+...+\theta_{k}=1\} convC={θ1x1+...+θkxk∣xi∈C,θi>0,i=1,...,k,θ1+...+θk=1}
凸包总是凸的,它是包含 C C C的最小凸集
锥:如果对于任意
x
∈
C
x \in C
x∈C和
θ
≥
0
\theta \geq 0
θ≥0都有
θ
x
∈
C
\theta x \in C
θx∈C,则集合
C
C
C是锥或非负齐次
凸锥:如果几个
C
C
C是锥,并且是凸的,则它是凸锥
锥组合:具有
θ
1
x
1
+
.
.
.
+
θ
k
x
k
≥
0
\theta_{1}x_{1}+...+\theta_{k}x_{k} \geq 0
θ1x1+...+θkxk≥0形式的点称为
x
1
,
.
.
.
,
x
k
x_{1},...,x_{k}
x1,...,xk的锥组合。集合
C
C
C是凸锥的重要条件是它包含其元素的所有锥组合
锥包:集合
C
C
C的锥包是
C
C
C中元素所有锥组合的集合,它是包含
C
C
C的最小凸锥
超平面是具有下面形式的集合:
{ x ∣ a T x = b } \{x|a^{T}x=b\} {x∣aTx=b}
因此,超平面可看作是关于
x
x
x的线性方程的解空间,也是一个仿射集合
一个超平面把
R
n
R^{n}
Rn划分为两个半空间。半空间可看作线性不等式的解空间:
{ x ∣ a T x ≤ b } \{x|a^{T}x \leq b\} {x∣aTx≤b}
半空间是凸的,但不是仿射的
Euclid球的公式表达如下:
B
(
x
c
,
r
)
=
{
x
∣
∣
∣
x
−
x
c
∣
∣
2
≤
r
}
=
{
x
∣
(
x
−
x
c
)
T
(
x
−
x
c
)
≤
r
2
}
它表示由距离球心 x c x_{c} xc距离不超过 r r r的所有点。Euclid球很容易证明是凸集,设有 ∣ ∣ x 1 − x c ∣ ∣ ≤ r , ∣ ∣ x 2 − x c ∣ ∣ ≤ r , 0 ≤ θ ≤ 1 ||x_{1}-x_{c}|| \leq r,||x_{2}-x_{c}|| \leq r, 0 \leq \theta \leq 1 ∣∣x1−xc∣∣≤r,∣∣x2−xc∣∣≤r,0≤θ≤1,那么:
∣
∣
θ
x
1
+
(
1
−
θ
)
x
2
−
x
c
∣
∣
2
=
∣
∣
θ
(
x
1
−
x
c
)
+
(
1
−
θ
)
(
x
2
−
x
c
)
∣
∣
2
≤
θ
∣
∣
x
1
−
x
c
∣
∣
2
+
(
1
−
θ
)
∣
∣
x
2
−
x
c
∣
∣
2
≤
r
与Euclid球相关的是椭球,形式如下:
ξ = { x ∣ ( x − x c ) T P − 1 ( x − x c ) ≤ 1 } \xi=\{x|(x-x_{c})^{T}P^{-1}(x-x_{c}) \leq 1\} ξ={x∣(x−xc)TP−1(x−xc)≤1}
其中 P = P T P=P^{T} P=PT是对称正定矩阵,它决定了椭球从 x c x_{c} xc向各个方向扩展的幅度
范数球的形式如下:
{ x ∣ ∣ ∣ x − x c ∣ ∣ ≤ r } \{x|||x-x_{c}|| \leq r\} {x∣∣∣x−xc∣∣≤r}
范数球是凸的
范数锥是集合:
C = { ( x , t ) ∣ ∣ ∣ x ∣ ∣ ≤ t } ⊆ R n + 1 C=\{(x,t)|||x|| \leq t\} \subseteq R^{n+1} C={(x,t)∣∣∣x∣∣≤t}⊆Rn+1
范数锥是凸锥
多面体是指有限个线性等式和不等式的解集:
P = { x ∣ a j T x ≤ b j , j = 1 , . . . , m , c j T x = d j , j = 1 , . . . , p } P=\{x|a_{j}^{T}x \leq b_{j},j=1,...,m,c_{j}^{T}x=d_{j},j=1,...,p\} P={x∣ajTx≤bj,j=1,...,m,cjTx=dj,j=1,...,p}
多面体是有限个半空间和超平面的交集,是凸集,仿射集合、射线、线段和半空间都是多面体
单纯形是一类重要的多面体。设
k
+
1
k+1
k+1个点
v
0
,
.
.
.
,
v
k
∈
R
n
v_{0},...,v_{k} \in R^{n}
v0,...,vk∈Rn仿射独立,也就是
v
1
−
v
0
,
.
.
.
,
v
k
−
v
0
v_{1}-v_{0},...,v_{k}-v_{0}
v1−v0,...,vk−v0线性独立,这些点决定了一个单纯形:
C
=
c
o
n
v
{
v
0
,
.
.
.
,
v
k
}
=
{
θ
0
v
0
+
.
.
.
+
θ
k
v
k
∣
θ
0
+
.
.
.
+
θ
k
=
1
,
∀
θ
i
≥
0
}
这个单纯形的仿射维数是k,也叫做 R n R^{n} Rn空间的k维单纯形。一维单纯形是一条线段,二维单纯形是一个三角形,三维单纯形是一个四面体
首先用 S n S^{n} Sn表示堆成矩阵的集合:
S n = { X ∈ R n x n ∣ X = X T } S^{n}=\{X \in R^{nxn}|X=X^{T}\} Sn={X∈Rnxn∣X=XT}
用 S + n S_{+}^{n} S+n表示对称半正定矩阵的集合:
S + n = { X ∈ S n ∣ X ≥ 0 } S_{+}^{n}=\{X \in S^{n}|X \geq 0\} S+n={X∈Sn∣X≥0}
集合
S
+
n
S_{+}^{n}
S+n是一个凸锥:如果
θ
1
,
θ
2
≥
0
\theta_{1},\theta_{2}\geq 0
θ1,θ2≥0并且
A
,
B
∈
S
+
n
A,B \in S_{+}^{n}
A,B∈S+n,那么
θ
1
A
+
θ
2
B
∈
S
+
n
\theta_{1}A+\theta_{2}B \in S_{+}^{n}
θ1A+θ2B∈S+n
关注公众号:老刘聊广告,获取更多知识总结和广告领域前沿算法
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。