- 简介每天都有有关滥用生成式人工智能(GenAI)创建有害深度伪造的报告出现。最近,防御性水印技术正在兴起,它使GenAI提供者能够在其图像中隐藏指纹以供后来用于深度伪造检测。然而,它的潜力尚未得到充分发掘。我们提出了UnMarker——对防御性水印技术的第一个实用的通用攻击。与现有攻击不同,UnMarker不需要检测器反馈,不需要对方案或类似模型有不切实际的了解,也不需要可能不可用的高级去噪管道。相反,UnMarker是对水印技术范例进行深入分析的产物,揭示了强健方案必须在光谱幅度中构建它们的水印。UnMarker使用两种新颖的对抗优化来干扰带水印图像的光谱,从而抹掉水印。对SOTA的评估证明了其有效性,不仅能够击败传统方案,同时与现有攻击相比保持更高的质量,而且还能破解改变图像结构的语义水印,将最佳检测率降至43%,使它们无用。据我们所知,UnMarker是对语义水印的第一个实用攻击,这被认为是强健水印技术的未来。UnMarker对这种对策的本质提出了疑问,并暴露了其自相矛盾的本质,因为设计强健性方案必然会损害其他强健性方面。
- 图表
- 解决问题本论文旨在解决生成对抗网络(GAN)技术被用于制作有害deepfakes的问题,并提出了一种名为UnMarker的攻击方法来破解防御性水印技术,从而使其失去防御深度伪造的能力。
- 关键思路UnMarker攻击方法通过对防御性水印图像的频谱进行干扰,从而消除水印,无需检测器反馈、无需对方案或类似模型有不切实际的了解,并且不需要高级去噪流水线。相比现有攻击方法,UnMarker攻击方法不仅具有更高的攻击效果,而且能够破解语义水印,将最佳检测率降至43%,从而使其无用。
- 其它亮点论文通过提出一种名为UnMarker的攻击方法,破解了防御性水印技术的防御能力,该方法无需检测器反馈、无需对方案或类似模型有不切实际的了解,并且不需要高级去噪流水线。UnMarker攻击方法不仅具有更高的攻击效果,而且能够破解语义水印,将最佳检测率降至43%,从而使其无用。论文的实验结果证明了该方法的有效性。
- 最近在该领域中,还有一些相关的研究,如:《Deep Learning for Image Steganography: A Survey》、《Deep Learning for Steganalysis of JPEG Images》等。
沙发等你来抢
去评论
评论
沙发等你来抢