- 简介过去十年中,基于深度学习的语音增强技术取得了显著进展。然而,现有的语音增强研究在语音增强子任务的覆盖范围、数据多样性和数量以及评估指标方面存在局限性。为了填补这一空白并促进通用语音增强研究,我们建立了一个名为URGENT的新的语音增强挑战赛,专注于语音增强的通用性、鲁棒性和泛化性。我们旨在扩展语音增强的定义,涵盖不同的子任务,以探索语音增强模型的极限,从去噪、去混响、带宽扩展和去失真开始。我们提出了一个新的框架,将所有这些子任务统一到单个模型中,允许使用所有现有的语音增强方法。我们收集了来自不同领域的公共语音和噪声数据,构建了多样化的评估数据。最后,我们讨论了基于生成和判别式语音增强方法的初步基线实验所获得的见解,使用了12个筛选出的指标。
- 图表
- 解决问题本论文旨在填补现有语音增强(SE)研究在SE子任务覆盖范围、数据多样性和数量以及评估指标方面的限制,通过建立一个新的SE挑战赛URGENT,专注于SE的通用性、鲁棒性和泛化性。
- 关键思路论文提出了一个新的框架,将去噪、去混响、带宽扩展和去削波等不同的SE子任务统一到单一模型中,从而探索SE模型的极限,使用所有现有的SE方法。
- 其它亮点论文收集了来自不同领域的公共语音和噪声数据来构建多样化的评估数据,通过12个策划指标进行了初步的基线实验,并使用生成式和判别式SE方法。
- 最近的相关研究包括Deep Complex U-Net、SEGAN和Wave-U-Net等。
沙发等你来抢
去评论
评论
沙发等你来抢