- 简介机器学习模型正被越来越多地应用于关键应用程序中,因此保护其完整性和所有权至关重要。最近的研究发现,对抗训练和水印技术存在冲突。本文介绍了一种新的框架,将对抗训练与水印技术相结合,以加强对逃避攻击的防御,并在知识产权盗窃的情况下提供可靠的模型验证。我们使用对抗训练和对抗水印技术来训练一个强大的水印模型。关键的直觉是使用更高的扰动预算来生成对抗性水印,以避免与对抗训练的预算冲突。我们使用MNIST和Fashion-MNIST数据集来评估我们提出的技术在各种模型窃取攻击中的表现。所得到的结果在鲁棒性能方面始终优于现有基线,并进一步证明了该防御措施对于剪枝和微调删除攻击的弹性。
- 图表
- 解决问题如何将对抗训练和水印技术结合以提高模型的安全性和保护知识产权?
- 关键思路将对抗训练和对抗水印相结合,使用更高的扰动预算生成对抗水印,从而避免冲突,训练出更加稳健的水印模型。
- 其它亮点论文提出了一种新的框架,用于集成对抗训练和水印技术,以增强对逃避攻击的防御能力,并在知识产权盗窃的情况下提供可靠的模型验证。作者在MNIST和Fashion-MNIST数据集上进行了实验,并展示了该技术在各种模型盗窃攻击中的鲁棒性表现。
- 在最近的研究中,也有一些关于对抗训练和水印技术相结合的工作,如“Adversarial Watermarking with a Subspace Approach”和“Robust Deep Learning with Adversarial Training and Random Projections”。
沙发等你来抢
去评论
评论
沙发等你来抢