赞
踩
在FL的场景中,参与者可能不情愿参与没有补偿的训练因为这会导致它白白损失资源来训练模型以及承受隐私泄露的风险。同时,激励机制还可以减少信息不对称(server和worker)造成的负面影响。一个优秀的激励机制可能有以下特征:
激励可协调、可信:每个worker都可以获得最优的补偿,只要他们诚实地工作;也就是说,他们作恶的话是不会提高收益的
个人的合理性:也就是说worker参与FL的收益是非负的
账单平衡:对workers的总支付不会大于给定的预算
计算有效:在多项式时间内,激励机制可以完成worker的选举和奖励的分配
公平性:当预定义的公平方程(贡献公平)达到最值的时候,激励机制就可以达到公平。公平的激励机制可以最优地分配奖励
(p,c,r)
p:参与方,他们提供有用的训练资源
c:用来衡量每个worker的贡献的一个方法
r:基于c的,对每个worker给与奖励的方法
特别地,设计激励机制的目的就是worker的最优参与程度和最优的奖励来维系FL的可持续性
所以说,激励机制最为关键的就是贡献评估和奖励分配
在FL中,如果能获取更高的奖励,自利的DO将会有更高的意愿加入FL;然而,这从另外一个角度来说,是对MO造成更大的财力消耗。因此,需要设计贡献评估来平衡一下。文献22展示了关于诚实DO的贡献、恶意DO的行为以及面向攻击的防御机制的分析;文献23采用了注意力机制来评估纵向FL中的DO的梯度贡献。这个方法,可以对每个DO进行实时贡献的衡量,拥有对数据数量和质量的高敏感度。文献24提出了一种基于逐步贡献计算的直觉贡献评价方法。文献25中,作者提出了一种基于强化学习的贡献评价方法。特别地,文献26提出了一种称作“基于peer预测的成对相关协议”在没有测试集的情况下评估FL中的用户贡献,它通过使用用户上传的**关于模型参数的统计相关性“来进行具体评估。
然而,22-24的方法都假设了一个前提,那就是有可信的中心server会诚实的计算每个DO的贡献,这个假设会缺失透明性然后会阻碍实际中FL的成功。为了解决这个问题,基于区块链的p2p支付系统(27-28)提出来支持通过共识协议并基于SV的利益分配来取代传统的第三方。同时,为了阻止恶意行为,29的作者提出了一种基于框架的评分规则来促使DO可信地上传他们地模型。
目前FL中贡献评估的主流策略可以分为以下几种:
在评估完DO的贡献之后,MO应该要对DO分发奖励来留住和提高提供高质量数据DO的数量
在这一届中,我们对FL的训练过程、基本架构、优势进行介绍。此外,FL激励机制的基础也讨论了。例如,概念定义和动机。下一届我们展示一些基础的经济学和博弈论模型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。