赞
踩
无秩序代价 POA
定义为策略型参与者自组织情况下系统的表现与系统最优表现得比例。
用于表示局部最优解汇总与全局最优解的接近程度。
部分系统中,局部最优解的汇总就是全局最优解。POA接近于1。
纳什定理
任何一个有限的双人博弈都含有纳什均衡。
纳什定理在任何含有有限人数的博弈中都成立。
纳什均衡是否可以由一种算法或者一个策略型参与者自己很快计算出来呢?部分简单的博弈中,可以使用线性规划、迭代学习等算法求解纳什均衡。这些算法的结果使得我们相信纳什均衡对于零和博弈有很好的预测能力。
但是在非零和双人博弈中,并不存在能计算纳什均衡的快速算法。计算双人博弈的纳什均衡是一个少有的、自然的且展现出中等计算困难度的问题。
只有存在有效算法快速求解均衡,均衡对于博弈的预测能力才具有意义。博弈中也可能存在多个纳什均衡,均衡的不唯一性也削弱了均衡的预测能力。对于计算机从业者来说,严格均衡的不可计算性使得我们开始研究计算可行的均衡概念,例如相关均衡、粗糙相关均衡。
二价拍卖中的动机
在二价拍卖中,每一个竞拍者 i i i都有占优策略,即将自己的报价 b i b_i bi设定为自己的真正估值 v i v_i vi。
二价拍卖的占优策略表明,二价拍卖对于参与者来说很容易参与,只需根据自己的估值喜好出价即可,不需要过分关注其他参与者。而一价拍卖中,如果按照真实喜好报价,只会保证自己的效用为0(无论获胜与否)。
证明过程:
其他竞拍者的报价向量为
b
−
i
b_{-i}
b−i,我们需要证明其他竞拍者报价任意的前提下,竞拍者
i
i
i的效用在
b
i
=
v
i
b_i=v_i
bi=vi时最大。令
B
=
m
a
x
j
≠
i
b
j
B=max_{j\neq i}b_j
B=maxj=ibj表示除i以外的最高报价。如果
b
i
<
B
b_i<B
bi<B,那么输掉竞拍,效用为0。如果
b
i
>
=
B
b_i>=B
bi>=B,那么赢得竞拍,效用为
v
i
−
B
v_i-B
vi−B。当
v
i
<
B
v_i<B
vi<B时,最高效用为
m
a
x
{
0
,
v
i
−
B
}
=
0
max\{0,v_i-B\}=0
max{0,vi−B}=0,
i
i
i说谎不会获得更高收益。当
v
i
>
=
B
v_i>=B
vi>=B时,最高效用为
m
a
x
{
0
,
v
i
−
B
}
=
v
i
−
B
max\{0,v_i-B\}=v_i-B
max{0,vi−B}=vi−B,
i
i
i说谎同样不会获得更高收益。
二价拍卖中的非负效用
二价拍卖都保证每一个说真话的竞拍者的效用不为负。
无论竞拍输赢,易得竞拍者的效用都非负。这条也叫做个体理性,所有参与者提前预估自己的期望效用,非负才有参加的动力。
占优策略激励相容 DSIC
在一场拍卖中,如果对于每一个竞拍者按照自己的估值真实报价都是一个占优策略,并且真实报价的竞拍者的效用都非负,则称这个拍卖是占优策略激励相容。
二价拍卖的理想性
1.二价拍卖是DSIC的。
2.二价拍卖是社会福利最大化的。
3.二价拍卖可以在输入量的多项式时间内实施。
DSIC的性质使得参与者的报价选择变得容易,也使得机制设计者对于拍卖结果的预测变得容易。社会福利最大化这个性质,即使卖家提前不知道竞拍者的估值,拍卖也能选出最高估值的竞拍者。二价拍卖可以让拍品来到最需要的人手里(真实估值最高)。
可实施的分配规则
对于一个单参数环境,对于一个分配规则 x x x,如果存在一个支付规则 p p p使得直接显示机制 ( x , p ) (x,p) (x,p)是DSIC的,那么就称这个分配规则 x x x是可实施的。
DSIC占优策略激励相容是指,说真话是占优策略并且符合个体理性。如果针对分配规则 x x x可以找到一个支付规则 p p p使得组合后的机制是DSIC的,那么该分配规则就是可实施的。
也就是说DSIC机制的分配规则一定是可实施的。可实施的分配规则决定了“机制设计的空间”。例如分配方式为拍品分配给出价最高的竞拍者,那么存在一种支付规则,也就是二价拍卖,使得组合后的机制是DSIC的。
单调分配规则
简而言之,在一个单调分配规则下,更高的出价会为你赢得更多的物品(或者单物品拍卖中获得更高的获胜概率)。
迈尔森引理内容
1.一个分配规则 x x x是可实施的,当且仅当它是单调的。
2.如果 x x x是单调的,那么存在唯一的支付规则,使得直接显示机制 ( x , p ) (x,p) (x,p)是DSIC的,且使得对于所有报价 b i = 0 b_i=0 bi=0均有 p i ( b ) = 0 p_i(\bold{b})=0 pi(b)=0。
3.(2)中的支付规则有明确的表达式。
迈尔森引理的内容将分配规则的两条特性以及支付规则串联了起来。(1)表明了分配规则的可实施性与单调性是等价的,可实施性如果本身不好判断的话,可以通过单调性来判断。(2)(3)表明了,通过单调性判断可实施性之后,一定存在唯一的支付规则,满足要求且为DSCI,并且该支付规则可以用表达式明确表示。
在背包拍卖中,每一个竞拍者 i i i都有一个公开的规模 w i w_i wi和一个私有的估值。卖家有容量 W W W。可行集合 X X X是一个 0 − 1 0-1 0−1向量 ( x 1 , . . . , x n ) (x_1,...,x_n) (x1,...,xn),且 ∑ i = 1 n w i x i < = W \sum_{i=1}^n w_ix_i <=W ∑i=1nwixi<=W。
背包拍卖可以简单理解为算法中的单物品非0-1背包问题,只不过物品的获得通过拍卖实现。举个例子说明,电视台在某个时间段有
W
W
W长度的空闲时间可以用来播放广告,每个竞拍者都有想要播放的广告长度
w
i
w_i
wi以及可以接受的最大出价
v
i
v_i
vi(广告要么不播,要么完全播放,不存在部分满足竞拍者的需求的情况)。
我们想为实现背包拍卖设计一个理想机制。理想机制的设计一般遵从两步走策略:1.假设收到的报价都是真实的,并给出分配规则。2.设计一个支付规则,将该分配规则扩展为一个DSIC机制。
1.将竞拍者按照以下公式的顺序从高到低排序: b 1 w 1 > = b 2 w 2 > = . . . > = b n w n \frac{b_1}{w_1}>=\frac{b_2}{w_2}>=...>=\frac{b_n}{w_n} w1b1>=w2b2>=...>=wnbn
2.按照这个顺序依次选取赢家,直到背包剩余容量容纳不下新的竞拍者的规模,算法停止。
3.要么返回上一步中的解,要么直接返回最高报价者。判断方法是,对比这两者的社会福利值,哪个更大就返回哪个。
贪心思想如何理解?假设每位竞拍者都真实出价,那么出价越高的代表自己的内心估值越高,对拍品的渴望程度也就越强,对社会福利的贡献也就越大。并且如果竞拍者的需求量越小,就越方便满足更多的竞拍者。换个思路理解,出价除以需求量,可以理解为单位需求的出价密度,当然是越高越优先。
算法何时停止?这类似一个整数背包问题,首先按照贪心顺序,最大化的填满整体规模,当然最后可能会剩下一小块空间,无法支持当前下一个竞拍者的全部规模。
为什么需要二者选一?可能存在一个估值非常高并且规模同时很大的竞拍者,其按照贪心思想并不优先,很可能得不到机会满足。但可能只满足这一个“巨无霸”,就会获得更大的社会福利。
背包拍卖的近似保证
如果竞价都是真实的,那么使用贪心算法分配下的社会福利至少是最大社会福利的 50 % 50\% 50%。
证明思路:贪心算法的第二步其实是非整数背包的前
k
k
k项估值之和,易得第三步返回的结果至少是非整数背包最优值的二分之一。并且整数背包的最优值小于等于非整数背包,因此原结论得证。
算法机制设计的特点:对于一个NP-Hard的优化问题,首先检查是否可以依靠最先进的近似算法直接实现DSIC机制,如果不行,就将这个问题进行调整,或者设计一种新的近似算法,并尽量保证这种新的算法仍然满足近似率的要求。
在任意单参数环境下,若估值分布为 F 1 , . . . , F n F_1,...,F_n F1,...,Fn,在所有满足DSIC的机制 ( x , p ) (x,p) (x,p)中,对于任意智能体 i i i和其他智能体的估值组合 v − i v_{-i} v−i,都有 E v i ∼ F i [ p i ( v ) ] = E v i ∼ F i [ ψ i ( v i ) × x i ( v ) ] E_{v_i \sim F_i}[p_i(v)]=E_{v_i\sim F_i}[\psi_i(v_i)\times x_i(v)] Evi∼Fi[pi(v)]=Evi∼Fi[ψi(vi)×xi(v)]。
也就是说,对于每一个智能体,其期望支付等于其期望虚拟估值。
在任意单参数环境下,若估值分布为 F 1 , . . . , F n F_1,...,F_n F1,...,Fn,在所有满足DSIC的机制 ( x , p ) (x,p) (x,p)中,都有: E v ∼ F [ ∑ i = 1 n p i ( v ) ] = E v ∼ F [ ∑ i = 1 n ψ i ( v i ) × x i ( v ) ] E_{v\sim F}[\sum_{i=1}^np_i(v)]=E_{v\sim F}[\sum_{i=1}^n\psi_i(v_i)\times x_i(v)] Ev∼F[∑i=1npi(v)]=Ev∼F[∑i=1nψi(vi)×xi(v)]
也就是说,期望收益等于期望虚拟福利。
结论表明,即便我们关心的只是收益,我们仍然只需要聚焦在分配规则的优化问题上。之前研究的最大化社会福利的机制设计中,也只是关心分配规则的优化问题上,收益最大化机制设计与之唯一不同的地方就在于,将实际估值函数替换为了虚拟估值。在单物品拍卖中,虚拟福利最大化分配规则就是将物品分配给虚拟估值最高的竞拍者。
4.目前我们已经确定了收益最大化机制的分配规则,那么按照迈尔森定理,我们接下来需要证明分配规则满足单调性,从而利用迈尔森定理设计支付规则。一个完整的收益最大化机制就被设计出来了。
正则分布
如果估值分布 F F F对应的虚拟估值函数 v − 1 − F ( v ) f ( v ) v-\frac{1-F(v)}{f(v)} v−f(v)1−F(v)是关于 v v v非减的,则称该估值分布是正则的。
分配规则单调性
如果所有分布函数都是正则分布,那么虚拟福利最大化分配规则就是单调性的。
对于每个元素都服从独立分布的序列 G 1 , . . . , G n G_1,...,G_n G1,...,Gn,存在一个策略能够保证期望收益至少是 1 2 E π ∼ G [ m a x i π i ] \frac{1}{2}E_{\pi \sim G}[max_i\pi_i] 21Eπ∼G[maxiπi]。另外存在一个这样的阈值策略,当且仅当 π i \pi_i πi至少达到阈值 t t t时才接受奖励 i i i。
虚拟阈值分配规则
1.选择t,使得 P r [ m a x i ψ i ( v i ) + > = t ] = 1 2 Pr[max_i\psi_i(v_i)^+>=t]=\frac{1}{2} Pr[maxiψi(vi)+>=t]=21
2.如果有竞拍者 i i i的 ψ i ( v i ) + > = t \psi_i(v_i)^+>=t ψi(vi)+>=t,就将物品分配给 i i i,当存在多个这样的竞拍者时,随机分配给任意一个打破僵局。
虚拟阈值分配规则是近似最优的,实际收益至少为1/2的最优收益。
带“竞拍者走向”保留价的二价拍卖
1.给每个竞拍者设置特定的保留价 r i = ψ i − 1 ( t ) r_i=\psi_i^{-1}(t) ri=ψi−1(t),其中t与虚拟阈值规则中定义相同。
2.如果存在一个竞价最高的竞拍者,且他的竞价超过保留价,就将物品分配给这个竞拍者。
拥有竞拍者定向保留价的二价拍卖在两个方面比最优拍卖更简单。第一,虚拟估值函数只是用来设置保留价。第二,竞价最高的竞拍者要赢得物品,只需要竞价超过他自己的保留价。
多参数最大化福利机制
在任意的一般化的机制设计环境中,都存在一个福利最大化的DSIC机制。
在单参数环境下,我们使用迈尔森引理,来将可实施的分配规则制定合适的支付规则补充为一个DSIC机制。但是当环境不是单参数时,迈尔森引理就不成立了。此时VCG机制应运而生,VCG机制就是为了多参数环境制定了一种DSIC机制的通用解法。
VCG机制
分配规则和支付规则分别如下式的机制 ( x , p ) (x,p) (x,p)叫作VCG机制。
分
配
规
则
最
大
化
社
会
福
利
:
x
(
b
)
=
a
r
g
m
a
x
ω
∈
Ω
∑
i
=
1
n
b
i
(
ω
)
支
付
规
则
支
付
自
己
的
外
部
性
:
p
i
(
b
)
=
(
m
a
x
ω
∈
Ω
∑
j
≠
i
b
j
(
ω
)
)
−
∑
j
≠
i
b
j
(
ω
∗
)
分配规则最大化社会福利:x(b)=argmax_{\omega \in \Omega}\sum_{i=1}^n b_i(\omega)\\ 支付规则支付自己的外部性:p_i(b)=(max_{\omega \in \Omega}\sum_{j\neq i}b_j(\omega))-\sum_{j\neq i}b_j(\omega^*)
分配规则最大化社会福利:x(b)=argmaxω∈Ωi=1∑nbi(ω)支付规则支付自己的外部性:pi(b)=(maxω∈Ωj=i∑bj(ω))−j=i∑bj(ω∗)
支付规则中,
ω
∗
\omega^*
ω∗是由上面分配规则决定的结果,前一项表示不考虑
i
i
i的效用,寻找最大化其他智能体效用总和的结果。每位智能体支付自己的外部性,也就是自己的边际效用,因为自己的加入对结果造成影响,所带来的其他智能体效用总和的损失。
成对匹配肾脏交换机制
1.从智能体 i i i收集一个汇报 F i F_i Fi。
2.建立图 G = ( V , E ) G=(V,E) G=(V,E)。点与边的含义上面已介绍。
3.返回图 G G G中的一个最大(基数)匹配。
该机制中还存在一个问题:最大匹配是指某个边集中边的个数最多,并且满足所有边没有相同端点。那么可能最大匹配有多个,对应相同的边数,我们该如何选择呢?一个解决方案是在机制开始前就给所有病人-供体对排出一个优先级,参考的因素比如等待时间、兼容难易程度、病重程度等等。根据以下算法返回唯一的最大匹配。以下算法中假设顶点
{
1
,
2
,
.
.
.
,
n
}
\{1,2,...,n\}
{1,2,...,n}按照优先级排序。
肾脏匹配优先级机制是DSIC的。因此不存在虚假的汇报使得机制产生更好的结果。这里虚假的汇报,不可能汇报与自己不匹配的结果,只可能汇报的匹配集合比真实集合更小。
自私路由的严格POA界
在所有代价函数集合为 C C C的网络中,和Pigou示例类似的网络的POA最大。
该定理的存在,可以将计算最差POA的问题归约成很简单的问题。我们想要找出POA最大的网络,只需要在类似Pigou示例的网络中进行搜索就可以了。可以理解为一个网络的POA值由两大因素决定,一是代价函数集合 C C C,另一个是网络结构。而类似Pigou示例的网络结构下的POA值是相同代价函数集合中的最大值,也就是上界。
类似Pigou网络的组成成分:
1.两个顶点 o 、 p o、p o、p。
2.从起点到终点的两条边,一条边在上面,一条边在下面。
3.非负的交通流率 r r r。
4.下面那条边的代价函数 c ( x ) c(x) c(x)。
5.上面那条边的代价函数处处相等且为 c ( r ) c(r) c(r)。
类似Pigou网络中最少时间代价就可以写成:
i
n
f
0
<
=
x
<
=
r
{
x
⋅
c
(
x
)
+
(
r
−
x
)
⋅
c
(
r
)
}
inf_{0<=x<=r}\{x\cdot c(x)+(r-x)\cdot c(r)\}
inf0<=x<=r{x⋅c(x)+(r−x)⋅c(r)}
类似Pigou网络中的POA为:
s
u
p
x
>
=
0
{
r
⋅
c
(
r
)
x
⋅
c
(
x
)
+
(
r
−
x
)
⋅
c
(
r
)
}
sup_{x>=0}\{\frac{r\cdot c(r)}{x\cdot c(x)+(r-x)\cdot c(r)}\}
supx>=0{x⋅c(x)+(r−x)⋅c(r)r⋅c(r)}
代价函数集合为
C
C
C时的Pigou界为:
α
(
C
)
=
s
u
p
c
∈
C
s
u
p
r
>
=
0
s
u
p
x
>
=
0
{
r
⋅
c
(
r
)
x
⋅
c
(
x
)
+
(
r
−
x
)
⋅
c
(
r
)
}
\alpha(C)=sup_{c\in C}sup_{r>=0}sup_{x>=0}\{\frac{r\cdot c(r)}{x\cdot c(x)+(r-x)\cdot c(r)}\}
α(C)=supc∈Csupr>=0supx>=0{x⋅c(x)+(r−x)⋅c(r)r⋅c(r)}
自私路由的严格POA界
对于所有代价函数的集合 C C C及代价函数属于 C C C的自私路由网络,其POA至多是 α ( C ) \alpha(C) α(C)。
在所有自私路由网络中,若 r > 0 r>0 r>0,则交通流率为 r r r的均衡分流的代价至多等于交通流量为 2 r 2r 2r的最优分流的代价。
单元自私路由的POA界
在代价函数为仿射函数的单元自私路由网络中,POA至多为5/2。
单元自私路由的POA界
在代价函数为仿射函数的单元自私路由网络中,POA至多为5/2。
一个均衡分流对应一个POA,而单元自私路由多个均衡分流的代价不同,因此对应多个POA值。因此才有了定理中POA至多为5/2的结论(针对于所有均衡分流)。
该定理证明过程如下:
我们的目标在于找出所有均衡分流的POA上界,最优分流代价固定的前提下,也就是找到均衡分流的代价上界。令
f
∗
f^*
f∗表示最优分流,
f
e
f_e
fe和
f
e
∗
f_e^*
fe∗表示分流
f
f
f和
f
∗
f^*
f∗中使用边
e
e
e的智能体数目(一个智能体拥有1个单位的交通流,因此每条边上的交通流数目都是整数)。仿射函数
c
e
(
x
)
=
a
e
x
+
b
e
c_e(x)=a_ex+b_e
ce(x)=aex+be,其中
a
e
,
b
e
>
=
0
a_e,b_e>=0
ae,be>=0。
证明第一步:
假设
f
f
f是均衡分流。智能体
i
i
i在
f
f
f中选择路径
p
i
p_i
pi,在
f
∗
f^*
f∗中选择路径
p
i
∗
p_i^*
pi∗,假设智能体
i
i
i选择路径由
p
i
p_i
pi偏移到
p
i
∗
p_i^*
pi∗。我们可以得到如下式子:
∑
e
∈
p
i
c
e
(
f
e
)
<
=
∑
e
∈
p
i
∗
∩
p
i
c
e
(
f
e
)
+
∑
e
∈
p
i
∗
\
p
i
c
e
(
f
e
+
1
)
\sum_{e\in p_i}c_e(f_e)<=\sum_{e\in p_i^* \cap p_i}c_e(f_e)+\sum_{e\in p_i^* \backslash p_i}c_e(f_e+1)
e∈pi∑ce(fe)<=e∈pi∗∩pi∑ce(fe)+e∈pi∗\pi∑ce(fe+1)
不等号右侧需要解释一下。
e
∈
p
i
∗
∩
p
i
e\in p_i^* \cap p_i
e∈pi∗∩pi是指
p
i
p_i
pi与
p
i
∗
p_i^*
pi∗共同的部分流量不变。
e
∈
p
i
∗
\
p
i
e\in p_i^* \backslash p_i
e∈pi∗\pi是指
p
i
∗
p_i^*
pi∗独有的部分因为策略便宜导致流量+1。我们利用均衡分流的假设得到了每个智能体均衡代价的上界。
证明第二步:
将所有智能体个人的均衡代价上界相加,得到总体均衡上界为:
∑
i
=
1
k
∑
e
∈
p
i
c
e
(
f
e
)
<
=
∑
i
=
1
k
(
∑
e
∈
p
i
∗
∩
p
i
c
e
(
f
e
)
+
∑
e
∈
p
i
∗
\
p
i
c
e
(
f
e
+
1
)
)
\sum_{i=1}^{k}\sum_{e\in p_i}c_e(f_e)<=\sum_{i=1}^k(\sum_{e\in p_i^* \cap p_i}c_e(f_e)+\sum_{e\in p_i^* \backslash p_i}c_e(f_e+1))
i=1∑ke∈pi∑ce(fe)<=i=1∑k(e∈pi∗∩pi∑ce(fe)+e∈pi∗\pi∑ce(fe+1))
由于代价函数是非减的,将
c
e
(
f
e
)
c_e(f_e)
ce(fe)放缩到
c
e
(
f
e
+
1
)
c_e(f_e+1)
ce(fe+1)得到:
∑
i
=
1
k
∑
e
∈
p
i
c
e
(
f
e
)
<
=
∑
i
=
1
k
∑
e
∈
p
i
∗
c
e
(
f
e
+
1
)
\sum_{i=1}^{k}\sum_{e\in p_i}c_e(f_e)<=\sum_{i=1}^k\sum_{e\in p_i^*}c_e(f_e+1)
i=1∑ke∈pi∑ce(fe)<=i=1∑ke∈pi∗∑ce(fe+1)
针对于
∑
i
=
1
k
\sum_{i=1}^k
∑i=1k其实就是统计所有代理者的路径中经过边
e
e
e的数目,这个数目其实是
f
e
∗
f_e^*
fe∗
∑
i
=
1
k
∑
e
∈
p
i
c
e
(
f
e
)
<
=
∑
e
∈
E
f
e
⋅
c
e
(
f
e
+
1
)
\sum_{i=1}^{k}\sum_{e\in p_i}c_e(f_e)<=\sum_{e\in E}f_e\cdot c_e(f_e+1)
i=1∑ke∈pi∑ce(fe)<=e∈E∑fe⋅ce(fe+1)
最后代入仿射函数的具体形式:
∑
i
=
1
k
∑
e
∈
p
i
c
e
(
f
e
)
<
=
∑
e
∈
E
[
a
e
f
e
∗
(
f
e
+
1
)
+
b
e
f
e
∗
]
\sum_{i=1}^{k}\sum_{e\in p_i}c_e(f_e)<=\sum_{e\in E}[a_ef_e^*(f_e+1)+b_ef_e^*]
i=1∑ke∈pi∑ce(fe)<=e∈E∑[aefe∗(fe+1)+befe∗]
证明第三步:
我们利用如下不等式:
对于所有的 y , z ∈ { 0 , 1 , 2 , 3 , . . . } y,z\in \{0,1,2,3,...\} y,z∈{0,1,2,3,...}有: y ( z + 1 ) < = 5 3 y 2 + 1 3 z 2 y(z+1)<=\frac{5}{3}y^2+\frac{1}{3}z^2 y(z+1)<=35y2+31z2
我们令
y
=
f
e
∗
,
z
=
f
e
y=f_e^*,z=f_e
y=fe∗,z=fe得到:
C
(
f
)
<
=
∑
e
∈
E
[
a
e
(
5
3
(
f
e
∗
)
2
+
1
3
f
e
2
)
+
b
e
f
e
∗
]
C(f)<=\sum_{e\in E}[a_e(\frac{5}{3}(f_e^*)^2+\frac{1}{3}f_e^2)+b_ef_e^*]
C(f)<=e∈E∑[ae(35(fe∗)2+31fe2)+befe∗]
将
b
e
f
e
∗
b_ef_e^*
befe∗放缩到
5
3
b
e
f
e
∗
\frac{5}{3}b_ef_e^*
35befe∗得:
C
(
f
)
<
=
5
3
[
∑
e
∈
E
f
e
∗
(
a
e
f
e
∗
+
b
e
)
]
+
1
3
∑
e
∈
E
a
e
f
e
2
C
(
f
)
<
=
5
3
[
∑
e
∈
E
f
e
∗
c
e
(
f
e
∗
)
]
+
1
3
∑
e
∈
E
a
e
f
e
2
C
(
f
)
<
=
5
3
∑
i
=
1
k
∑
e
∈
p
i
∗
c
e
(
f
e
∗
)
+
1
3
∑
i
=
1
k
∑
e
∈
p
i
c
e
(
f
e
)
C
(
f
)
<
=
5
3
C
(
f
∗
)
+
1
3
C
(
f
)
C(f)<=\frac{5}{3}[\sum_{e\in E}f_e^*(a_ef_e^*+b_e)]+\frac{1}{3}\sum_{e\in E}a_ef_e^2\\ C(f)<=\frac{5}{3}[\sum_{e\in E}f_e^*c_e(f_e^*)]+\frac{1}{3}\sum_{e\in E}a_ef_e^2\\ C(f)<=\frac{5}{3}\sum_{i=1}^k\sum_{e \in p_i^*}c_e(f_e^*)+\frac{1}{3}\sum_{i=1}^k\sum_{e \in p_i}c_e(f_e)\\ C(f)<=\frac{5}{3}C(f^*)+\frac{1}{3}C(f)
C(f)<=35[e∈E∑fe∗(aefe∗+be)]+31e∈E∑aefe2C(f)<=35[e∈E∑fe∗ce(fe∗)]+31e∈E∑aefe2C(f)<=35i=1∑ke∈pi∗∑ce(fe∗)+31i=1∑ke∈pi∑ce(fe)C(f)<=35C(f∗)+31C(f)
证明第四步:
解得:
C
(
f
)
<
=
5
3
⋅
3
2
C
(
f
∗
)
=
5
2
⋅
C
(
f
∗
)
C(f)<=\frac{5}{3}\cdot \frac{3}{2}C(f^*)=\frac{5}{2}\cdot C(f^*)
C(f)<=35⋅23C(f∗)=25⋅C(f∗)
选址博弈的POA界
任意选址博弈的POA至少是1/2,在最坏情况下POA的界为1/2。
选址博弈的特殊性质以及POA界定理证明略。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。