最近马萨诸塞大学阿默斯特分校、Adobe研究院等机构提出了一种叫做MakeItTalk的新方法,不仅能让真人头像说话,还可以让卡通、油画、素描、日漫中的人像说话。 这项研究提出的方法将输入音频信号中的内容和说话人身份信息分离开来:音频内容用来稳健地控制嘴唇及周围区域的运动;说话人信息则决定面部表情的细节和人物的头部动态。 该方法的另一个重要组件是预测能够反映说话人动态的面部特征点。基于该中间表征,该方法能够为真人头部图像合成说话状态视频。此方法还可用于艺术作品、素描、2D卡通人物、日漫、随手涂鸦等图像。

内容中包含的图片若涉及版权问题,请及时与我们联系删除