Musical Word Embedding for Music Tagging and Retrieval

2024年04月21日
  • 简介
    词嵌入已成为基于文本的信息检索的重要手段。通常,词嵌入是从大量的一般和非结构化的文本数据中学习得到的。然而,在音乐领域,词嵌入可能难以理解音乐上下文或识别与音乐相关的实体,如艺术家和音轨。为解决这个问题,我们提出了一种新的方法,称为音乐词嵌入(MWE),它涉及从各种类型的文本中学习,包括日常词汇和与音乐相关的词汇。我们将MWE集成到音频-词汇联合表示框架中,用不同程度的音乐特定性的词汇,如标签、艺术家和音轨,进行标记和检索音乐。我们的实验表明,使用更具体的音乐词汇,如音轨,可以获得更好的检索性能,而使用不太具体的术语,如标签,则可以获得更好的标记性能。为了平衡这种折衷,我们建议使用具有不同音乐特定性级别的词汇进行多原型训练。我们在两个数据集(Million Song Dataset和MTG-Jamendo)上评估了词嵌入和音频-词汇联合嵌入在四个任务(标签排名预测、音乐标记、按标签查询和按音轨查询)上的表现。我们的发现表明,建议的MWE比传统的词嵌入更高效、更健壮。
  • 图表
  • 解决问题
    论文旨在解决在音乐领域中使用词嵌入进行信息检索时,难以理解音乐上下文或识别音乐相关实体的问题。论文提出了一种名为Musical Word Embedding(MWE)的新方法来解决这个问题。
  • 关键思路
    论文的关键思路是将MWE与音频-词汇联合表示框架相结合,以标记和检索音乐。该框架使用具有不同音乐特定级别的单词,如标签、艺术家和曲目。通过使用多原型训练来平衡牺牲,可以同时使用具有不同音乐特定级别的单词。实验结果表明,使用更具体的音乐单词如曲目可以获得更好的检索性能,而使用不太具体的术语如标签可以获得更好的标记性能。
  • 其它亮点
    论文使用了两个数据集(Million Song Dataset和MTG-Jamendo)进行四项任务(标签排名预测、音乐标记、按标签查询和按曲目查询)的评估。实验结果表明,MWE比传统的词嵌入更有效和稳健。
  • 相关研究
    最近的相关研究包括《A Survey of Music Information Retrieval》、《Deep content-based music recommendation》、《Content-based music information retrieval: Current directions and future challenges》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论