Improving Real-Time Music Accompaniment Separation with MMDenseNet

简介

音源分离旨在将复杂的音乐分离成不同类型的声源。目前大多数方法都侧重于通过使用更大的模型结构来提高分离结果的质量，这使它们不适用于边缘设备。此外，当输入的持续时间很短时，这些方法可能会产生低质量的输出，这使它们不适用于实时应用。因此，本文的目标是改进一种轻量级模型MMDenstNet，以在实时应用中在分离质量和延迟之间取得平衡。本文探讨或提出了不同的改进方向，包括复杂的理想比例掩模、自注意力、带合并分离方法和特征回溯。源失真比、实时因子和最佳延迟被用来评估性能。为了符合我们的应用要求，本文的评估过程侧重于伴奏部分的分离性能。实验结果表明，我们的改进在保持可接受的分离质量的同时，实现了低实时因子和最佳延迟。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在增强一个轻量级模型，以在实时应用中平衡分离质量和延迟。
关键思路

论文提出了多种改进方向，包括复杂的理想比例掩模、自注意力、带合并分离方法和特征回溯，以提高模型的分离质量和实时性能。
其它亮点

论文使用源-失真比、实时因子和最优延迟来评估性能，重点关注伴奏部分的分离性能。实验结果表明，改进后的模型在保持可接受的分离质量的同时，实现了低实时因子和最优延迟。
相关研究

在相关研究方面，最近的工作包括使用深度学习进行音乐源分离的各种方法，如基于深度神经网络的方法和基于非负矩阵分解的方法。

Improving Real-Time Music Accompaniment Separation with MMDenseNet

提问交流

提问交流