- 简介最近的扩散模型在音频降噪任务中取得了有希望的表现。反向过程的独特属性可以恢复干净的信号。然而,现实世界噪声的分布不符合单一的高斯分布,甚至是未知的。高斯噪声条件的采样限制了它的应用场景。为了克服这些挑战,我们提出了一个DiffGMM模型,这是一个基于扩散和高斯混合模型的降噪模型。我们采用反向过程来估计高斯混合模型的参数。给定一个有噪音的音频信号,我们首先应用1D-U-Net来提取特征,并训练线性层来估计高斯混合模型的参数,从而近似真实的噪声分布。将估计的噪声不断地从有噪音的信号中减去,输出干净的音频信号。广泛的实验结果表明,所提出的DiffGMM模型达到了最先进的性能水平。
- 图表
- 解决问题本文旨在解决音频去噪模型中实际噪声分布不符合单一高斯分布且未知的问题,提出了一种基于扩散和高斯混合模型的DiffGMM模型。
- 关键思路DiffGMM模型通过反向过程估计高斯混合模型的参数,进而对噪声分布进行近似,从而不再受限于高斯噪声采样条件,提高了应用场景的可行性。
- 其它亮点本文在实验中展示了DiffGMM模型的优异性能,并提供了开源代码。值得进一步研究的是,如何将该模型应用于其他领域以及如何进一步提高模型的性能。
- 在音频去噪领域,最近的相关研究包括:“Deep Complex U-Net for Inverse Problems in Imaging”和“Non-Intrusive Audio Quality Assessment Using Deep Learning Models”。
沙发等你来抢
去评论
评论
沙发等你来抢