Defending Against Repetitive-based Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off

向作者提问

NEW

简介

半监督学习（Semi-supervised learning，SSL）通过利用互联网上大量的未标记数据，在仅有一小部分标记数据的情况下取得了显著的性能。然而，这些大量的未受信任的数据极易受到数据污染，从而导致潜在的后门攻击。目前的后门防御措施还不能有效应对SSL中的这种漏洞。本研究提出了一种新的方法——未标记数据净化（Unlabeled Data Purification，UPure），通过在频域中引入扰动，破坏触发模式和目标类之间的关联。通过利用速率-失真-感知（Rate-Distortion-Perception，RDP）权衡，我们进一步确定了添加扰动的频带，并证明了这种选择的合理性。值得注意的是，UPure无需额外的干净标记数据即可净化被污染的未标记数据。对四个基准数据集和五个SSL算法进行的广泛实验表明，UPure有效地将攻击成功率从99.78％降至0％，同时保持模型准确性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本篇论文试图解决半监督学习中的数据污染和后门攻击的问题，提出了一种新的方法来净化未标记数据，以降低模型受到攻击的风险。
关键思路

论文提出了一种名为UPure的方法，通过在频域中引入扰动来打破触发模式和目标类之间的关联，从而净化被污染的未标记数据。该方法不需要额外的干净标记数据，通过权衡速率、失真和感知的关系来选择添加扰动的频带。
其它亮点

论文在四个基准数据集和五个半监督学习算法上进行了广泛的实验，表明UPure可以将攻击成功率从99.78％降低到0％，同时保持模型的准确性。该方法不仅可以有效地净化未标记数据，还可以提高模型的鲁棒性，具有很高的实用性。
相关研究

近期在这个领域中的相关研究包括《A Survey of Backdoor Attacks in Deep Learning》、《Backdoor Attacks and Defenses in Deep Learning: A Survey》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问