- 简介最近文本生成音乐模型的进展开辟了音乐创作的新途径。然而,音乐生成通常需要迭代改进,而如何编辑生成的音乐仍然是一个重大挑战。本文介绍了一种新的方法来编辑这种模型生成的音乐,可以修改特定的属性,如流派、情绪和乐器,同时保持其他方面不变。我们的方法将文本编辑转换为潜在空间操作,并添加额外的约束以强制一致性。它可以与现有的预训练文本到音乐扩散模型无缝集成,无需额外的训练。实验结果在风格和音色转移评估中展示了优于零样本和某些监督基线的性能。此外,我们展示了我们的方法在实际音乐编辑场景中的实际应用。
- 图表
- 解决问题本文旨在解决音乐生成模型生成的音乐编辑困难的问题,提出一种新的方法,可以在保持其他方面不变的情况下修改特定属性,如流派、情绪和乐器。
- 关键思路本文提出了一种基于潜在空间操作的编辑方法,并添加了额外的约束以确保一致性。该方法与现有的预训练文本生成音乐模型无缝集成,无需额外的训练。
- 其它亮点本文的实验结果表明,在风格和音色转移评估中,与零样本和某些监督基线相比,具有卓越的性能。此外,本文展示了该方法在实际音乐编辑场景中的实际应用。
- 最近的相关研究包括:'Music Transformer','MuseNet','Jukebox'等。
沙发等你来抢
去评论
评论
沙发等你来抢