in2IN: Leveraging individual Information to Generate Human INteractions

向作者提问

NEW

简介

在许多领域中，如机器人技术、游戏、动画和元宇宙，基于文本描述生成人与人之间的运动互动是非常有用的应用。然而，这种应用的实现也面临着建模高维度人际动态的巨大困难。此外，准确捕捉互动的个体多样性也具有很大的挑战。目前的方法由于可用数据集和调节策略的限制，生成的互动个体动态多样性有限。因此，我们引入了一种新的扩散模型in2IN，用于生成人际运动，它不仅受到整体互动的文本描述的影响，还受到参与互动的每个人所执行的动作的个体描述的影响。为了训练这个模型，我们使用一个大型语言模型来扩展InterHuman数据集，加入个体描述。结果，in2IN在InterHuman数据集中实现了最先进的性能。此外，为了增加现有互动数据集中的个体多样性，我们提出了DualMDM，一种模型组合技术，将in2IN生成的运动和在HumanML3D上预先训练的单人运动先验生成的运动相结合。结果，DualMDM生成的运动具有更高的个体多样性，改善了对个体动态的控制，同时保持了人际一致性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文的问题是如何生成多人运动交互的模型，尤其是如何解决局限于数据集和条件策略的情况下，生成交互时缺乏个体动态多样性的问题。
关键思路

本论文提出了一种新的扩散模型 in2IN，不仅可以根据整体交互的文本描述，还可以根据每个参与者的动作描述来生成多人运动交互。同时，还提出了一种模型组合技术 DualMDM，将 in2IN 生成的动作与单人运动先验生成的动作相结合，以增加个体动态多样性。
其它亮点

本论文使用大型语言模型扩展 InterHuman 数据集，以便在训练 in2IN 时使用。实验结果表明，in2IN 在 InterHuman 数据集上的性能达到了最先进水平。此外，DualMDM 可以生成具有更高个体动态多样性的动作，并提高对个人动态的控制能力，同时保持人际一致性。论文还开源了代码。
相关研究

在这个领域中，最近的相关研究包括：Learning Social Affordances for Human-Robot Interaction，Socially Aware Motion Planning with Deep Reinforcement Learning，Generating Diverse Human Motion with Adversarial Semi-Supervised Variational Autoencoders 等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问