- 简介Federated Learning(FL)为在网络设备(例如移动设备、IoT边缘节点)上进行机器学习模型分布式训练提供了隐私保护机制。它通过在网络上不共享实际数据来实现边缘人工智能(AI)的创建。现有的研究通常侧重于非独立同分布数据和客户端系统特征的异构性等通用方面,但他们通常忽略了模型发展所需的数据不足问题,这可能来自于边缘节点上类标签分布不均和数据量高度变化的情况。在这项工作中,我们提出了FLIGAN,一种新颖的方法来解决FL中数据不完整的问题。首先,我们利用生成对抗网络(GANs)来灵活捕捉复杂数据分布,并生成与真实数据非常相似的合成数据。然后,我们使用合成数据来增强节点间数据集的鲁棒性和完整性。我们的方法遵循FL的隐私要求,通过在联邦方式下生成合成数据而不在过程中共享实际数据。我们采用类别抽样和节点分组等技术来提高联邦GAN的性能,从而实现高质量合成数据集的创建和有效的FL训练。我们实验的实证结果表明,FLIGAN显著提高了模型的准确性,特别是在高类别不平衡的情况下,相对于传统的FL基线模型,模型准确性提高了高达20%。
- 图表
- 解决问题解决FL中数据不完整问题,特别是在存在类别不平衡和数据量差异的情况下。
- 关键思路使用生成对抗网络(GAN)生成接近真实数据的合成数据,以提高FL中数据集的完整性和鲁棒性。
- 其它亮点使用了FLIGAN方法,采用类别采样和节点分组等技术提高GAN的性能,实现高质量的合成数据集。实验结果表明,FLIGAN可以显著提高模型的准确性,特别是在存在类别不平衡的情况下。
- 相关研究主要集中在处理非独立同分布数据和客户端系统特征异质性的问题上,但忽略了数据不完整性的问题。
沙发等你来抢
去评论
评论
沙发等你来抢