赞
踩
在联邦学习中,参与者进行本地模型 训练需要消耗本地的计算资源和通信资源,若是没有合理 的激励机制,参与者有可能出现不参与,消极参与,中途 退出等不好的情况。同时部分恶意参与者可能会破 坏训练过程。因此,需要设计相应的激励机制保持跨机构 合作的稳定性和持续性。
在跨机构联邦学习中,跨机构合作需要解决三个基本问题:高隐私性,数据异质性,公平性。
主流的隐私强化技术包括对上传更新添加噪声的差分隐私技术和对数据进行加密计算的同台加密技术。
差分隐私是目前广泛采用的隐私保护技 术,其基本思想是在个人敏感属性中添加噪声以保护隐 私。差分隐私技术的应用较为复杂,需要对噪声化的数据进行重建才能继续进行后续的运算。
相关的论文提出:
相较于添加噪声可能扭曲数据的差分隐私方法,有着 充足的计算和通信资源的机构更加喜欢对数据进行加密 计算的同态加密技术,因为数据计算的精确性更高。
跨机构联邦学习中的数据异质性指的是不同机构之间的数据具有不同的特征分布、数据类型、数据规模或数据 质量等方面的差异。
数据异质性普遍存在于一些拥有规模小且碎片化的数据的 机构之间,促使这些机构更加容易合作,充分提高碎片化 数据的利用率。数据异质性虽然有激励小机构互相合作 的作用,但更多的是对跨机构合作过程和模型训练的负面影响。
机构之间的非独立同分布指的是不同机构参与合作的数据在概率分布上不完全相同或独立同分布的情况。数据的非独立同分布会导致全局模型的泛化能力受限,同时 可能导致全局模型在某些机构的训练数据上过拟合,而在其他机构上欠拟合。
待解决的问题
对于数据异质性带来的诸多负面影响,一个直观的解决方法是选择近似数据分布和相近规模的机构加入联邦学 习,这样不仅可以使得参与者的局部模型收敛速度相近, 也可以规避不同数据分布和特征分布带来的数据差异问题。
相关论文理论提出:
选择参与者需要考虑因素:
公平是机构合作的基本要素,跨机构联邦学习的公平性问题是激励机制研究的重点方向。
跨机构联邦学习的公平性:
相关理论论文的提出:
基本问题之间不是独立存在的,他们之间存在关联性和制约关系。
以全局模型为中心的合作模式是指所有参与者将其本 地数据用于训练局部模型,将更新后的局部模型参数发送 到参数服务器,参数服务器负责聚合所有参与者的模型参 数,然后更新全局模型,并将更新后的模型参数再次分发 给参与者。
奖励机制是指根据参与者的数据贡献以及对全局模型 的有效影响来分配“奖励”以激励机构积极参与数据共享 和模型训练。常见的的奖励机制包括数据贡献奖励、模型 贡献奖励、模型性能奖励等。奖励机制通常有两个部分组 成:贡献评估和奖励分配。
目前的奖励机制主要还是以虚拟代币或者全局模型的 适用性作为奖励,其中虚拟代币可以转化为相应的物质收 益,并设计相应的贡献评估机制(如 Shapley 值)作为分 配机制,对高贡献的参与者给予相应的奖励,以此激励其 贡献更多的数据。研究者们可以在贡献评估的准确性和 “奖励”形式的多样性上进行深入研究,同时也需要考虑 奖励分配的公平性和可持续性。
激励预算是指为促使机构参与联邦学习并贡献其数据 和资源所需的成本。在一次跨机构合作中,激励预算是有 限的,合理分配每个训练轮次的激励资源,可以有效的提 高全局模型的训练效率以及减少资源的过度消耗。
目前在激励预算方面的激励机制研究较少,但却是机 构合作的关键要点之一,机构不太可能在激励方面投入大 量的资源,而得到相对较少的回报。因此,如何降低激励 成预算并合理分配激励资源将成为一个值得深入讨论的研 究方向
以参与者为中心的合作模式是指每个参与机构都保留 其本地数据,并在本地进行模型训练。训练后的模型参数 通常不会离开参与者的设备,只有模型的更新版本(例如 梯度)被聚合或共享给其他参与者。
如图 3 所示,模式一 由参与者轮流作为聚合中心聚合更新梯度,模式二则是所 有参与者均为聚合中心,参与者之间共享更新梯度。这种 模式下,数据和模型都分布在各个参与者之间,没有一个 中心化的全局模型。由于参与者之间的个体差异,不同机 构的数据资源、模型需求等不尽相同,所以需要一种个性 化的联邦学习[9]方法来满足其个性化的需求,以参与者为 中心的合作模式就是一种个性化的联邦学习,相应的激励 机制设计也更加偏向参与者而非全局模型。
数据演变指的是在跨机构合作中,参与者所持有的数 据随着时间的推移和合作进展发生变化的现象。这种数据 演变可能涉及新的数据样本的加入、数据标签的更新或更 正,以及数据特征的变化。随着时间的推移,参与者可能新增、删除或修改其数据,这可能导致模型的性能变化、 数据不一致性或概念漂移等问题,进而影响跨机构合作发 展的稳定性。
参与者之间的合作关系会因为机构的业务需求、合作 协议调整或者组织结构变化等原因而发生变动。这种合作 关系的变动会影响跨机构合作发展的稳定性和持续性,例 如业务需求的冲突会导致参与者可能不愿意贡献高质量的 数据,合作协议的调整可能使参与者中途退出跨机构联邦 学习等。
本节对目前的跨机构联邦学习的激励机制研究的性能 特性进行对比分析,从个体理性、激励相容性、帕累托效 率、预算平衡、鲁棒性和计算成本 6 个方面进行比较。以下是部分特性的说明:
https://link.cnki.net/urlid/50.1075.TP.20240109.1331.020
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。