“柯南领结”变成现实，字节跳动智创语音团队SAMI发布新一代实时AI变声方案

NLP

常政 2022-08-04 13:14 分享

以下文章来源于mp.weixin.qq.com

字节跳动智能创作语音团队 SAMI（Speech, Audio and Music Intelligence）近日发布了新一代的低延迟、超拟人的实时 AI 变声技术。不同于传统的变声，AI 变声是基于深度学习的声音转换（Voice Conversion）技术来实现的，可以实现任意发音人的音色定制，极大程度保留原始音色的特点。

该方案的亮点如下：

在 CPU 单核上就能做到极低延迟的实时输入实时变声，就像 “柯南领结” 一样；
能够高度还原输入语音的抑扬顿挫、情感、口音，甚至连轻微的呼吸、咳嗽声也能还原；
媲美真人的高保真音质，以及高度的目标音色一致性；

预计这项技术未来在虚拟人、短视频玩法、客服服务、直播互动玩法上有着很大的落地空间。

阅读详细报道

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论