- 简介音源分离旨在将复杂的音乐分离成不同类型的声源。目前大多数方法都侧重于通过使用更大的模型结构来提高分离结果的质量,这使它们不适用于边缘设备。此外,当输入的持续时间很短时,这些方法可能会产生低质量的输出,这使它们不适用于实时应用。因此,本文的目标是改进一种轻量级模型MMDenstNet,以在实时应用中在分离质量和延迟之间取得平衡。本文探讨或提出了不同的改进方向,包括复杂的理想比例掩模、自注意力、带合并分离方法和特征回溯。源失真比、实时因子和最佳延迟被用来评估性能。为了符合我们的应用要求,本文的评估过程侧重于伴奏部分的分离性能。实验结果表明,我们的改进在保持可接受的分离质量的同时,实现了低实时因子和最佳延迟。
-
- 图表
- 解决问题本论文旨在增强一个轻量级模型,以在实时应用中平衡分离质量和延迟。
- 关键思路论文提出了多种改进方向,包括复杂的理想比例掩模、自注意力、带合并分离方法和特征回溯,以提高模型的分离质量和实时性能。
- 其它亮点论文使用源-失真比、实时因子和最优延迟来评估性能,重点关注伴奏部分的分离性能。实验结果表明,改进后的模型在保持可接受的分离质量的同时,实现了低实时因子和最优延迟。
- 在相关研究方面,最近的工作包括使用深度学习进行音乐源分离的各种方法,如基于深度神经网络的方法和基于非负矩阵分解的方法。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流