- 简介本文介绍了第七届CHiME挑战赛中UDASE任务的目标和主观评估结果,并对结果进行了分析。该任务旨在利用测试领域的真实嘈杂语音记录,进行语音增强模型的无监督域自适应。具体而言,测试领域对应于CHiME-5数据集,其特点是在嘈杂和混响的家庭环境中进行的真实多人和对话语音记录,没有可用的地面真实干净语音信号。结果显示,主观评估结果与最近提出的几个监督非侵入性性能指标之间的相关性有限。相反,结果表明,更传统的侵入性客观指标可以用于使用为挑战开发的混响LibriCHiME-5数据集进行域内性能评估。主观评估表明,所有系统都成功减少了背景噪声,但总是以增加失真为代价。在四种经过主观评估的语音增强方法中,只有一种相对于未处理的嘈杂语音表现出整体质量的改善,突显了任务的难度。 CHiME-7 UDASE任务所创建的工具和音频材料与社区共享。
-
- 图表
- 解决问题本文旨在解决语音增强中的域适应问题,即如何在测试域中使用真实噪声数据进行无监督域适应,以提高语音增强模型的性能。
- 关键思路通过利用测试域中的真实噪声数据进行无监督域适应,以提高语音增强模型在测试域中的性能。研究表明,传统的侵入式客观度量标准可以用于基于测试域的性能评估。
- 其它亮点本文提供了CHiME-7 UDASE任务的客观和主观评估结果,并对结果进行了分析。实验使用CHiME-5数据集进行测试,结果表明,所有系统都成功减少了背景噪声,但是都会带来更多的失真。本文提供的工具和音频材料对社区进行共享。
- 在语音增强领域,最近的相关研究包括:1)使用深度学习模型进行语音增强;2)使用无监督域适应方法解决域适应问题;3)使用客观度量标准进行性能评估。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流