Explainable Deep Learning Analysis for Raga Identification in Indian Art Music

2024年06月04日
  • 简介
    “Raga识别”是音乐信息检索中一个非常流行的研究问题。少数研究探索了这个任务,采用了各种方法,如信号处理、机器学习(ML)方法,以及最近的基于深度学习(DL)的方法。然而,所有这些工作中仍存在一个关键问题:这些ML/DL方法是否以类似于人类专家的方式学习和解释Raga?此外,这项研究的一个重要障碍是缺乏丰富的标记数据集,这驱动了这些基于ML/DL的方法。在本文中,我们介绍了“Prasarbharti Indian Music”第1版(PIM-v1),这是一个新的数据集,包括191小时的精心标记的北印度古典音乐(HCM)录音,据我们所知,这是HCM录音中最大的标记数据集。我们的方法涉及进行消融研究,以使用PIM-v1数据集找到自动Raga识别(ARI)的基准分类模型。我们针对12个Raga类别的子集实现了0.89的块级F1分数。随后,我们采用模型可解释性技术来评估分类器的预测,以确定它们是否与Raga的人类理解相一致,还是由任意模式驱动。我们通过比较两个ExAI模型给出的解释与人类专家注释来验证模型预测的正确性。在此基础上,我们分析单个测试示例的解释,以了解解释中突出显示的区域在模型进行正确或错误预测时的作用。
  • 图表
  • 解决问题
    本文旨在解决音乐信息检索中的Raga识别问题。作者试图验证机器学习/深度学习方法是否能够像人类专家一样学习和解释Raga。此外,由于缺乏大量的标记数据集,作者还提出了一个包含191小时的Hindustani Classical Music录音的数据集。
  • 关键思路
    本文提出了一个基于深度学习的自动Raga识别模型,并使用作者提供的数据集进行了验证。通过对模型的解释,验证了模型的预测与人类专家的注释相一致。
  • 其它亮点
    本文的亮点包括:提供了一个大规模的Hindustani Classical Music数据集;提出了一个基于深度学习的自动Raga识别模型;使用模型解释技术验证了模型的预测与人类专家的注释相一致。
  • 相关研究
    与本文相关的研究包括:使用不同方法进行自动Raga识别的研究,如信号处理、机器学习等。其中一些研究包括:"A Comparative Study of Raga Recognition Techniques for Indian Classical Music"和"Automatic Raga Recognition using Convolutional Neural Networks"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论