Efficient Black-box Adversarial Attacks via Bayesian Optimization Guided by a Function Prior

2024年05月29日
  • 简介
    本文研究了一种具有挑战性的黑盒对抗攻击,其旨在通过仅使用模型的输出反馈来生成针对黑盒模型的对抗性样本。由于对抗性可转移性,一些先前的方法通过将白盒模型的梯度纳入基于查询的攻击中来提高查询效率。然而,局部梯度不够信息丰富,使得这些方法仍然需要大量查询。本文提出了一种先验引导的贝叶斯优化(P-BO)算法,将代理模型作为全局函数先验在黑盒对抗攻击中进行利用。由于代理模型包含黑盒模型的丰富先验信息,P-BO使用高斯过程对攻击目标进行建模,其均值函数初始化为代理模型的损失。我们对遗憾界进行了理论分析,表明P-BO的性能可能会受到不良先验的影响。因此,我们进一步提出了一种自适应集成策略,通过最小化遗憾界来自动调整函数先验上的系数。在图像分类器和大型视觉语言模型上的大量实验表明,与最先进的黑盒攻击相比,所提出的算法在减少查询和提高攻击成功率方面具有优越性。代码可在https://github.com/yibo-miao/PBO-Attack获得。
  • 图表
  • 解决问题
    本论文的问题是如何仅使用黑盒模型的输出反馈来生成对抗样本,并减少查询次数。
  • 关键思路
    本论文提出了一种基于先验引导贝叶斯优化算法的黑盒对抗攻击方法,利用代理模型作为全局函数先验,通过高斯过程对攻击目标进行建模。
  • 其它亮点
    本文的亮点包括提出了一种新的黑盒对抗攻击算法,可以减少查询次数并提高攻击成功率。实验结果表明,该算法在图像分类器和大型视觉语言模型上表现优异。代码已经开源。
  • 相关研究
    目前在这个领域的相关研究包括Query-Based黑盒攻击、基于梯度的代理模型攻击等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论