标题:微软|MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training(MusicBERT:符号音乐理解大规模预训练)

简介:象征性的音乐理解,指的是从符号数据中理解音乐(例如,MIDI 格式,但不是音频),涵盖了许多音乐应用程序,如流派分类、情感分类和乐曲匹配。虽然良好的音乐表征对这些应用有益,但缺乏训练数据阻碍了表征学习。受到自然语言处理中的预训练模型成功的启发,在本文中,我们开发了 MusicBERT,用于音乐理解的大规模预训练模型。为此,我们构建了一个包含超过100万首音乐歌曲的大型符号音乐语料库。自从象征性音乐包含更多的结构性(例如,条、位置)和各种信息(例如,速度、乐器和音高),只需采用 NLP 的预训练技术即可象征性的音乐只会带来边际收益。因此,我们设计了几种机制,包括 OctupleMIDI 编码和 bar-level掩蔽策略,以增强预训练符号音乐数据。实验证明了 MusicBERT 在四个方面的优势音乐理解任务,包括旋律完成,伴奏建议,流派分类,风格分类。消融研究还验证了我们在MusicBERT 中设计的 OctupleMIDI 编码和 barlevel 屏蔽策略。

论文地址:https://arxiv.org/pdf/2106.05630v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除