A Transfer Attack to Image Watermarks

2024年03月22日
  • 简介
    水印技术已被广泛应用于工业领域,用于检测由人工智能生成的图像。文献中已经很清楚地了解了这种基于水印的检测器在白盒和黑盒设置下对抗攻击的稳健性。然而,在非盒子设置下的稳健性远不如人们所知。特别是,多项研究声称图像水印在这种情况下是稳健的。在本研究中,我们提出了一种新的转移对抗攻击方法,用于对抗非盒子设置下的图像水印。我们的转移攻击向水印图像添加扰动,以逃避攻击者自己训练的多个代理水印模型,同时扰动后的水印图像也逃避了目标水印模型。我们的主要贡献在于理论和实证上都表明,基于水印的人工智能生成图像检测器即使攻击者没有访问水印模型或检测API,也不具有对抗攻击的稳健性。
  • 图表
  • 解决问题
    本文旨在探讨图像水印在非盒子设置下对抗攻击的鲁棒性问题,提出了一种新的转移攻击方法。
  • 关键思路
    本文提出了一种转移攻击方法,通过向带水印的图像添加扰动来逃避多个攻击者自己训练的替代水印模型,并且扰动后的带水印图像也可以逃避目标水印模型。
  • 其它亮点
    本文理论和实验证明,即使攻击者没有访问水印模型或检测API,基于水印的AI生成图像检测器也不具有对抗攻击的鲁棒性。实验使用了多个数据集,并提供了开源代码。
  • 相关研究
    近期的相关研究包括:《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》、《Adversarial Attacks and Defenses in Images, Graphs and Text: A Review》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论