- 简介将歌词写下来以供人类消费,不仅需要准确地捕捉单词序列,还需要加入标点和格式,以便清晰地传达上下文信息。这包括歌曲结构、情感强调以及主唱和伴唱之间的对比。虽然自动歌词转录(ALT)系统已经超越了产生非结构化单词字符串的阶段,并能够利用更广泛的上下文,但ALT基准测试并没有跟上步伐,继续专注于单词。为了弥补这一差距,我们介绍了Jam-ALT,一个全面的歌词转录基准测试。该基准测试对JamendoLyrics数据集进行了完整的修订,遵循歌词转录和格式的行业标准,并设计了评估指标以捕捉和评估歌词特定的细微差别,为提高歌词的可读性奠定了基础。我们将基准测试应用于最近的转录系统,并提供额外的错误分析,以及与古典音乐数据集的实验比较。
- 图表
- 解决问题本文旨在解决自动歌词转写系统(ALT)的评估标准落后于技术进步的问题,提出了一个全面的歌词转写基准Jam-ALT,以更好地评估歌词转写系统的性能。
- 关键思路Jam-ALT基准包括JamendoLyrics数据集的完整修订,遵循行业标准进行歌词转写和格式化,并引入了针对歌词特定细节的评估指标,为提高歌词的可读性奠定了基础。
- 其它亮点本文通过将Jam-ALT基准应用于最近的转写系统,并提供了额外的错误分析和与古典音乐数据集的实验比较,进一步展示了该基准的有效性。此外,作者还开源了JamendoLyrics数据集和评估代码,为未来的研究提供了便利。
- 近期在歌词转写领域的相关研究包括:'Lyrics Transcription: A New Benchmark Dataset and Evaluation Metrics','A Multi-Task Learning Approach for Automatic Lyrics Transcription'等。
沙发等你来抢
去评论
评论
沙发等你来抢