【论文标题】Neural Synthesis of Binaural Speech From Mono Audio
【作者团队】Alexander Richard, Dejan Markovic, Israel D. Gebru, Steven Krenn, Gladstone Alexander Butler, Fernando Torre, Yaser Sheikh
【发表时间】ICLR 2021
【论文链接】https://openreview.net/forum?id=uAX8q61EVRu
【公开代码】https://github.com/facebookresearch/BinauralSpeechSynthesis
【推荐理由】本文提出一种基于神经网络的音频处理方法,可以从单声道的声源生成相对于声源的相对位置和方向综合两通道双耳声音作为输出,并产生较好的结果。同时作者公布了相应的数据集和代码。
本文提出了一种双耳声音合成的神经渲染方法,可以实时产生真实和空间上精确的双耳声音。该网络以一个单通道声源作为输入,根据听者相对于声源的相对位置和方向综合两通道双耳声音作为输出。作者在理论分析中研究了原始波形的损耗的不足,并引入了克服这些局限性的改进损耗。在经验评估中,作者确定本文的方法是第一个产生空间上精确的波形输出(通过真实记录测量),并且在定量和知觉研究方面都比现有方法有相当大的优势。作者最后公开了使用的数据集以及代码。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢