BackdoorIndicator: Leveraging OOD Data for Proactive Backdoor Detection in Federated Learning

2024年05月31日
  • 简介
    在联邦学习系统中,分散的数据所有者(客户端)可以将本地训练的模型上传到中央服务器,共同训练全局模型。恶意客户端可能通过上传中毒的本地模型向全局模型植入后门,在遇到攻击者定义的触发器时导致对目标类的错误分类。现有的后门防御在不同的系统和对抗设置下表现不一致,特别是当恶意更新在统计上接近良性更新时。本文首先揭示了一个事实,即通过向相同目标标签植入后门可以显著帮助维护之前植入后门的准确性,然后提出了一种名为BackdoorIndicator的新型联邦学习主动后门检测机制,该机制使服务器利用超出分布(OOD)数据向全局模型注入指标任务,然后利用任何后门样本相对于良性样本都是OOD样本的事实,服务器可以准确地检测上传模型中的后门,而且完全不知道潜在的后门类型和目标标签,通过评估指标任务。我们进行了系统和广泛的实证研究,证明了BackdoorIndicator在各种系统和对抗设置下相对于基线防御具有始终优越的性能和实用性。
  • 图表
  • 解决问题
    本论文旨在解决分布式学习系统中的后门攻击问题,提出了一种新的主动后门检测机制BackdoorIndicator。
  • 关键思路
    BackdoorIndicator利用服务器注入的指示任务,通过评估指示任务来检测上传模型中是否存在后门攻击。相较于现有的后门防御机制,该方法具有更高的准确性和实用性。
  • 其它亮点
    论文通过系统和广泛的实验研究,证明了BackdoorIndicator在各种系统和对抗环境下都具有一致的优越性能和实用性。论文使用了开源数据集,但未提供开源代码。该研究为分布式学习系统中的安全问题提供了新的解决方案。
  • 相关研究
    与该研究相关的研究包括:Defending Against Backdoors in Federated Learning with Robust Collaborative Learning、Backdoor Attacks and Defenses in Deep Learning: A Survey等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论