Independent low-rank matrix analysis based on the Sinkhorn divergence source model for blind source separation

2024年01月03日
  • 简介
    这篇文章介绍了一种改进的独立低秩矩阵分析(ILRMA)算法,它考虑了不同频段之间的谱系数依赖性,以提高音频和语音信号的确定性盲源分离(BSS)性能。该方法假设不同频段的光谱是独立的,任何频段中的光谱系数都服从高斯分布。然后使用Itakura-Saito差异来估计与源模型相关的参数。然而,在现实中,不同频段的光谱系数可能是相关的,这在现有的ILRMA算法中没有考虑。为了利用跨频段信息提高BSS性能,本文使用Sinkhorn差异来优化源模型参数。但是,需要估计的参数数量也显著增加,计算复杂度也随之增加。为了降低算法复杂度,文章使用Kronecker积将建模矩阵分解为许多维度更小的矩阵的乘积。然后开发出一种高效的算法来实现基于Sinkhorn差异的BSS算法,并将复杂度降低一个数量级。
  • 图表
  • 解决问题
    论文旨在改进独立低秩矩阵分析(ILRMA)算法,以解决音频和语音信号的确定性盲源分离问题。现有的ILRMA算法假设不同频带的频谱是独立的,而且任何频带中的谱系数都是高斯分布的,但实际上不同频带的谱系数可能是相关的,这一点在现有的ILRMA算法中没有考虑。
  • 关键思路
    改进的ILRMA算法考虑了不同频带之间的谱系数相关性,利用Sinkhorn距离优化源模型参数,从而提高了盲源分离的性能。为了降低算法复杂度,采用Kronecker乘积将建模矩阵分解为若干维数较小的矩阵的乘积。
  • 其它亮点
    论文的实验结果表明,与现有的ILRMA算法相比,改进的算法在盲源分离的性能上有所提高。此外,为了降低算法复杂度,论文提出了一种高效的实现Sinkhorn距离的BSS算法的方法,并将算法复杂度降低了一个数量级。论文使用了公开数据集,并开源了代码。
  • 相关研究
    最近的相关研究包括:Sinkhorn自适应融合算法(SAFA)、多通道盲源分离(MCBSS)算法等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论