Ambisonizer: Neural Upmixing as Spherical Harmonics Generation

简介

神经上混音是一项活跃的研究领域，其任务是从较少的输入通道生成具有增加通道数的沉浸式音乐，其中单声道到立体声和立体声到环绕声上混音被视为不同的问题。本文提出了一种统一的神经上混音方法，将其作为球谐函数的形式 - 更具体地说是环绕声生成。我们明确将单声道上混音作为无条件生成，将立体声上混音作为有条件生成，其中立体声信号作为条件。我们提供证据表明，我们提出的方法在解码为立体声后，在主观评分上与强大的商业立体声扩展器相匹配。总体而言，我们的工作提出了直接上混音到环绕声格式作为神经上混音的一种强有力和有前途的方法。我们还提供了有关限制的讨论。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在提出一种新的神经网络方法，将少量通道的音频转换为具有更多通道的沉浸式音乐，解决单声道到立体声和立体声到环绕声的音频升降维问题。
关键思路

本文将神经网络方法应用于Ambisonic生成，将单声道升维视为无条件生成，将立体声升维视为有条件生成，并通过主观评分证明其效果优于商业立体声扩展器。
其它亮点

本文提出的神经网络方法在进行单声道到立体声和立体声到环绕声的音频升降维方面表现出色，实验结果优于商业立体声扩展器。作者还提供了实验数据和开源代码，为后续研究提供了便利。
相关研究

最近的相关研究包括：'End-to-End Neural Speech Enhancement with Generative Adversarial Networks'，'A Universal Music Translation Network'，'Deep Learning for Audio Signal Processing'等。

Ambisonizer: Neural Upmixing as Spherical Harmonics Generation

提问交流

提问交流