从Bayesian Deep Learning到Adversarial Robustness新范式

论文标题：

Adversarial Attacks are Reversible with Natural Supervision

论文链接：

http://wanghao.in/paper/ICCV21_ReverseAttack.pdf

代码链接：

https://github.com/cvlab-columbia/SelfSupDefense

视频链接：

https://www.youtube.com/watch?v=0Yv3eQ9JR4Y

Adversarial Robustness 新思路：可以说，这个 work 提出了一个 adversarial defense 的新范式，叫做 Reverse Attack。举个简单的例子，如下图，给定一个原始图片（下面左边的图），attacker 会通过比如 PGD 的方法，找到一个 attack vector（下面中间的图），叠加在原始图片上，而我们 reverse attack 的思路是，在 inference time（或者叫 test time）临时找到一个 reverse attack vector（下面右边的图），再次叠加在已经被 attack 过的图片上，从而来抵消掉部分 attack vector。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

从Bayesian Deep Learning到Adversarial Robustness新范式

评论