FreeMotion: A Unified Framework for Number-free Text-to-Motion Synthesis

2024年05月24日
  • 简介
    文本转动作合成是计算机视觉中的一个关键任务。现有的方法在普适性方面存在局限性,因为它们是为单人或双人场景量身定制的,无法用于生成更多人的动作。为了实现无人数动作合成,本文重新考虑了动作生成,并提出了通过条件运动分布来统一单人和多人运动的方法。此外,我们为我们的FreeMotion框架设计了一个生成模块和一个交互模块,以解耦条件运动生成的过程,最终支持无人数动作合成。此外,基于我们的框架,当前的单人运动空间控制方法可以无缝集成,实现对多人运动的精确控制。大量实验证明了我们的方法的优越性能以及我们同时推断单人和多人动作的能力。
  • 作者讲解
  • 图表
  • 解决问题
    该论文试图解决单人或双人场景下的文本到运动合成问题,现有的方法无法生成多人运动。论文提出了一种条件运动分布的方法,以实现无需确定人数的运动合成。
  • 关键思路
    论文中提出了FreeMotion框架,它包括生成模块和交互模块,将条件运动生成的过程分离,实现了单人和多人运动的统一。同时,该框架可以与现有的单人运动空间控制方法无缝集成,实现多人运动的精确控制。
  • 其它亮点
    论文通过实验验证了该方法的优越性,并展示了同时推断单人和多人运动的能力。论文使用了多个数据集进行实验,并开源了代码。值得关注的是,该方法可以应用于更广泛的多人场景,具有较好的普适性。
  • 相关研究
    最近的相关研究包括:《Multi-Performer Neural Speech Animation》、《Multi-Person Motion Transfer with Pose Constraints》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问