赞
踩
已有的数据中心学习架构,存在成本高昂,数据隐私和安全问题。在用户将数据上传到数据中心的过程中,敏感数据极易受到泄露、攻击和网络的影响。比如,万豪(2018年受影响的客户数为5亿)和eBay(2014年受影响的用户数为1.45亿)。在这种情况下,欧盟实施了一项名为《通用数据保护条例》(GDPR)的新法规,通过设置规则、限制数据共享和存储来保护个人数据。
基于上述的这些规则,On-site ML和FL已经成为替代数据中心的解决方案
将ML任务从云端转移到用户设备上,中央服务器将预训练或者通用的ML模型分发给用户,然后每个用户使用本地数据进行训练,对其进行个性化的定制。设备上的智能已被应用于许多应用,如皮肤癌检测、医疗应用、智能教室、神经网络辅助服务等
谷歌研究人员在2016年创造了FL,自那以后,它在学术界和工业界都获得了蓬勃发展,席卷全球。它旨在建立一个基于分布数据集的联邦学习模型,在保护数据隐私的前提下实现由多个参与者的本地数据训练出统一的机器学习模型。在FL中,原始数据保存在终端用户设备上,这些设备合作训练联合模型。中央服务器只负责接受并聚合各个用户设备的模型更新和结果,然后再将聚合后的模型发送给各个用户,从而使各个用户之间可以共享知识。
FL首先在谷歌的Android键盘Gboard上测试,当Gboard在屏幕上显示一些建议时,根据用户的行为,进行本地学习。然后,综合不同用户的行为,增强预测的结果。
目前已有的开源框架有:tensorflow federated(TFF),federated AI technology enabler(FATE), PySyft, PaddleFL, and Clara training framework。
在研究领域,主要有图像分类和NLP。常用的数据集,MNIST和CIFAR。
为什么联邦学习不属于典型的分布式学习,主要由于以下的挑战和特性:
FL在训练过程中,中央服务器和客户端之间需要多次通信。为了优化通信,已经有了许多的研究工作。
总结: 如果完全按照FL的机制在每轮中更新整个模型参数,在分布式环境中,由于参与设备众多,网络带宽有限,通信成为了FL的主要瓶颈。
在典型的FL中选择客户端时,只考虑正在充电、空闲和WiFi设备。因此,在这些设备中,确定一个随机数以发起与它们的通信并记录它们。然而,在处理通信和计算资源方面的异构客户端时,仅依赖这些标准会带来许多缺点,例如训练时间长。为了解决这些问题,很少有人提出工作。
FL的目标是本地训练模型,然后在服务器上聚合模型,经过多轮更新得到一个高质量的全局模型。
总结: 由于FL中的通信比计算要昂贵得多,因此优化和聚合算法对于最大限度地减少轮次、快速收敛模型和不给主干网造成负担至关重要。
由于数据是Non-IID的,在使用SGD优化模型时,会使模型产生偏差。
虽然现有的方法侧重于优化不同的FL方面,但很少有人考虑到客户不愿意参加训练或选择低质量模型更新的客户。如果服务器选择了一些客户端,它们往往会因有限的计算和通信能力而浪费资源。[61]通过基于契约理论设计一种激励机制来解决这一问题,该机制可以激励用户在FL中做出贡献。因此,客户x的数据质量越高,给予x的奖励就越多。
总结:在典型的FL中,假设服务器选择的所有客户端都始终可用。然而,这种乐观的假设并不能反映现实世界的情况。相当多的设备很可能在整个过程中退出,甚至由于资源成本和限制而拒绝加入。此外,为了更快地聚合全局模型,非常需要鼓励客户端提供高质量的数据。因此,提出了基于激励的方法来解决这些问题。
尽管FL的出现就是通过防止数据共享来实现严格的隐私保护,但与隐私和安全相关的新挑战已经出现。最近的研究表明,模型更新的传输仍然会泄露客户端敏感信息。
对上述隐私问题的保护,已有的研究主要解决方法
[1]. S. Abdulrahman, H. Tout, H. Ould-Slimane, A. Mourad, C. Talhi and M. Guizani, “A Survey on Federated Learning: The Journey From Centralized to Distributed On-Site Learning and Beyond,” in IEEE Internet of Things Journal, vol. 8, no. 7, pp. 5476-5497, 1 April1, 2021, doi: 10.1109/JIOT.2020.3030072.
[2] 王树森. https://www.youtube.com/watch v=STxtRucv_zo&list=PLvOO0btloRns6egXueiRju4DXQjNRJQd5&index=4
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。