- 简介半监督学习(Semi-supervised learning,SSL)通过利用互联网上大量的未标记数据,在仅有一小部分标记数据的情况下取得了显著的性能。然而,这些大量的未受信任的数据极易受到数据污染,从而导致潜在的后门攻击。目前的后门防御措施还不能有效应对SSL中的这种漏洞。本研究提出了一种新的方法——未标记数据净化(Unlabeled Data Purification,UPure),通过在频域中引入扰动,破坏触发模式和目标类之间的关联。通过利用速率-失真-感知(Rate-Distortion-Perception,RDP)权衡,我们进一步确定了添加扰动的频带,并证明了这种选择的合理性。值得注意的是,UPure无需额外的干净标记数据即可净化被污染的未标记数据。对四个基准数据集和五个SSL算法进行的广泛实验表明,UPure有效地将攻击成功率从99.78%降至0%,同时保持模型准确性。
-
- 图表
- 解决问题本篇论文试图解决半监督学习中的数据污染和后门攻击的问题,提出了一种新的方法来净化未标记数据,以降低模型受到攻击的风险。
- 关键思路论文提出了一种名为UPure的方法,通过在频域中引入扰动来打破触发模式和目标类之间的关联,从而净化被污染的未标记数据。该方法不需要额外的干净标记数据,通过权衡速率、失真和感知的关系来选择添加扰动的频带。
- 其它亮点论文在四个基准数据集和五个半监督学习算法上进行了广泛的实验,表明UPure可以将攻击成功率从99.78%降低到0%,同时保持模型的准确性。该方法不仅可以有效地净化未标记数据,还可以提高模型的鲁棒性,具有很高的实用性。
- 近期在这个领域中的相关研究包括《A Survey of Backdoor Attacks in Deep Learning》、《Backdoor Attacks and Defenses in Deep Learning: A Survey》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流