【论文标题】Adversarial Visual Robustness by Causal Intervention

【作者团队】Kaihua Tang,Mingyuan Tao,Hanwang Zhang

【发表时间】2021/06/17

【机构】南洋理工大学,阿里巴巴集团

【论文链接】https://arxiv.org/abs/2106.09534

本文出自南洋理工大学、阿里巴巴集团联合团队,作者针对被动的对抗性训练无法免疫未知攻击者的问题,提出了一种基于工具变量的因果干预方法,对自适应攻击具有很强的鲁棒性。

目前,对抗性训练是公认的最有前途的防御对抗性样本的手段。然而,它的被动特性不可避免地使其难以未知的攻击者产生免疫。为了实现主动防御,除了流行的有界威胁模型之外,我们还需要对对手的例子有更基本的了解。

在本文中,作者提出了一种对抗性安全隐患的因果视角:由于学习过程中普遍存在混杂因子,攻击者恰好可以利用混杂效应。因此,一种对抗鲁棒性的根本解决方案是因果干预。由于一般情况下无法观察到混杂因子,本文作者建议使用工具变量进行干预,而无需观察混杂因子。作者将这种鲁棒的训练方法称为基于工具变量的因果干预(CiiV)。它具有可微定位采样层和一致性损失,稳定且不受梯度模糊的影响。

实验结果表明,在 MNIST、CIFAR-10 和 mini-ImageNet 数据集上的各种攻击者和设置下进行的大量实验中,CiiV 对自适应攻击具有鲁棒性。

图 1:CiiV 模型架构图

内容中包含的图片若涉及版权问题,请及时与我们联系删除