GROOT: Generating Robust Watermark for Diffusion-Model-Based Audio Synthesis

2024年07月15日
  • 简介
    在生成模型如扩散模型的蓬勃发展中,区分合成音频与其自然对应物的任务变得越来越困难。深度伪造检测提供了一个可行的解决方案来应对这一挑战。然而,这种防御措施无意中推动了生成模型的持续改进。数字水印技术成为一种积极的和可持续的策略,预先规定合成内容的创建和传播。因此,本文作为先驱,提出了生成鲁棒音频水印方法(Groot),提供了一种范例来积极监督合成音频及其源扩散模型。在这个范式中,水印生成和音频合成的过程同时发生,由配备专用编码器的参数固定的扩散模型进行促进。嵌入在音频中的水印随后可以由轻量级解码器检索。实验结果突出了Groot的优异表现,特别是在鲁棒性方面,超过了领先的最先进方法。除了在单个后处理攻击方面表现出卓越的韧性外,Groot在面对复合攻击时也表现出了特殊的鲁棒性,保持了约95%的平均水印提取精度。
  • 图表
  • 解决问题
    提出一种先进的音频数字水印技术,以监管合成音频和其来源扩散模型,解决生成模型技术的滥用问题。
  • 关键思路
    提出了一种新的数字水印方案,将数字水印嵌入音频中,同时使用固定参数扩散模型和专用编码器生成音频和数字水印,使用轻量级解码器检测数字水印。
  • 其它亮点
    实验结果表明,该方法具有出色的鲁棒性,尤其是在面对复合攻击时,平均水印提取准确率约为95%。该方法还可以预防生成模型技术的滥用。
  • 相关研究
    最近的相关研究包括:1. "A Survey of Audio Watermarking Techniques" 2. "Audio Watermarking Using Singular Value Decomposition" 3. "Robust Audio Watermarking Based on Discrete Wavelet Transform and Singular Value Decomposition"
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论