Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding

2024年06月12日
  • 简介
    语音匿名化已经被开发成一种技术,通过将语音信号中的说话者声音替换为伪造的说话者的声音,从而掩盖原始的声音属性,以保护隐私。本文着重于改变声音属性以对抗机器识别,同时保留人类感知。我们将其称为异步语音匿名化。为此,采用了一种包含说话者解缠机制的语音生成框架来生成匿名语音。通过对说话者嵌入应用对抗扰动来改变说话者属性,同时通过控制扰动的强度来保留人类感知。对LibriSpeech数据集进行的实验表明,60.71%的处理语音中说话者属性被掩盖,而人类感知得到了保留。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在通过异步语音匿名化技术,改变说话者的声音属性,以保护隐私,同时保持人类感知,验证其有效性。
  • 关键思路
    本文采用了一种语音生成框架,其中包含说话者分离机制,通过对说话者嵌入的对抗扰动来改变说话者属性,同时通过控制扰动的强度来保持人类感知。
  • 其它亮点
    本文在LibriSpeech数据集上进行了实验,表明对60.71%的处理语音进行了说话者属性的匿名化,同时保持了人类感知。本文的亮点在于采用了异步语音匿名化技术,既保护隐私,又保持了人类感知。
  • 相关研究
    最近的相关研究包括使用自编码器进行语音匿名化,使用对抗性训练来提高语音匿名化的鲁棒性等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问