- 简介Federated Learning(FL)为在联网设备(如移动设备、物联网边缘节点)上分布式训练机器学习模型提供了一种保护隐私的机制。它通过在网络上不共享实际数据来实现边缘人工智能。现有研究通常关注于非独立同分布数据和客户端系统特征的异质性等通用方面,但它们经常忽视模型开发所需的数据不足问题,这可能来自于类标签分布不均和边缘节点数据量的高度变化。在这项工作中,我们提出了FLIGAN,一种解决FL中数据不完整问题的新方法。首先,我们利用生成对抗网络(GANs)来灵活捕捉复杂的数据分布并生成与真实世界数据非常相似的合成数据。然后,我们使用合成数据来增强节点之间数据集的鲁棒性和完整性。我们的方法遵循FL的隐私要求,通过在联邦方式下生成合成数据而不在过程中共享实际数据。我们采用类别采样和节点分组等技术来改善联邦GAN的性能,从而实现高质量合成数据集的创建和有效的FL训练。我们实验的实证结果表明,FLIGAN显著提高了模型的准确性,特别是在高类别不平衡的情况下,与传统的FL基线相比,模型准确性提高了高达20%。
- 图表
- 解决问题解决问题:本论文旨在解决联邦学习中数据不完整的问题,即在节点之间存在类别分布不均和数据量差异等问题,导致模型训练不准确的情况。
- 关键思路关键思路:该论文提出了一种名为FLIGAN的方法,利用生成对抗网络(GAN)生成类似真实数据的合成数据,并在联邦学习中使用这些合成数据来增强节点数据集的完整性和鲁棒性,从而提高模型的准确性。
- 其它亮点其他亮点:论文使用了类别抽样和节点分组等技术来提高FLIGAN的性能,实验结果表明,在存在类别不平衡的情况下,FLIGAN可以将模型准确率提高高达20%。论文使用了现有的数据集进行实验,并开源了代码,值得进一步研究。
- 相关研究:最近的研究主要集中在联邦学习中非独立同分布数据和节点异质性等方面,而忽视了数据不完整的问题。近期的相关研究包括“Federated Learning with Non-IID Data”和“Federated Learning on Non-stationary Heterogeneous Data”。
沙发等你来抢
去评论
评论
沙发等你来抢