A Survey of Fragile Model Watermarking

2024年06月07日
  • 简介
    模型脆弱性水印技术,受到对抗性攻击神经网络和传统多媒体脆弱性水印技术的启发,逐渐成为检测篡改的有效工具,并在近年来得到快速发展。与广泛用于识别模型版权的鲁棒性水印不同,模型脆弱性水印旨在识别模型是否遭受了意外的改变,例如后门、中毒、压缩等。这些改变可能对模型用户造成未知的风险,例如在典型的自动驾驶场景中误将停车标志识别为限速标志。本文概述了自模型脆弱性水印技术诞生以来该领域相关工作的概况,对其进行分类并揭示了该领域的发展轨迹,为未来的模型脆弱性水印技术研究提供了全面的调查。
  • 图表
  • 解决问题
    本文旨在介绍模型脆弱水印技术,以检测模型是否被篡改,防止模型被恶意修改后对用户造成未知风险。
  • 关键思路
    本文提出的模型脆弱水印技术可以有效地检测模型是否被篡改,相比于传统的鲁棒水印技术,更适用于检测模型是否存在后门、中毒、压缩等未知风险。
  • 其它亮点
    本文对模型脆弱水印技术的相关工作进行了梳理和分类,提供了未来研究的全面调查。实验使用了哪些数据集、是否开源代码等细节并未提及。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如《Towards Robust Detection of Adversarial Examples》、《Deep Learning Models Under Differential Privacy Constraints》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论