Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding

简介

语音匿名化已经被开发成一种技术，通过将语音信号中的说话者声音替换为伪造的说话者的声音，从而掩盖原始的声音属性，以保护隐私。本文着重于改变声音属性以对抗机器识别，同时保留人类感知。我们将其称为异步语音匿名化。为此，采用了一种包含说话者解缠机制的语音生成框架来生成匿名语音。通过对说话者嵌入应用对抗扰动来改变说话者属性，同时通过控制扰动的强度来保留人类感知。对LibriSpeech数据集进行的实验表明，60.71%的处理语音中说话者属性被掩盖，而人类感知得到了保留。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在通过异步语音匿名化技术，改变说话者的声音属性，以保护隐私，同时保持人类感知，验证其有效性。
关键思路

本文采用了一种语音生成框架，其中包含说话者分离机制，通过对说话者嵌入的对抗扰动来改变说话者属性，同时通过控制扰动的强度来保持人类感知。
其它亮点

本文在LibriSpeech数据集上进行了实验，表明对60.71％的处理语音进行了说话者属性的匿名化，同时保持了人类感知。本文的亮点在于采用了异步语音匿名化技术，既保护隐私，又保持了人类感知。
相关研究

最近的相关研究包括使用自编码器进行语音匿名化，使用对抗性训练来提高语音匿名化的鲁棒性等。

Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding

提问交流

提问交流