Following the Human Thread in Social Navigation

向作者提问

NEW

简介

在共享环境中，人类和机器人之间的协作成功取决于机器人对人类运动的实时适应。特别是在社交导航中，机器人应该足够靠近以提供帮助，但又准备好退后以让人类自由移动，避免碰撞。人类轨迹在社交导航中成为关键线索，但是从机器人的自我中心视角来看，它们只能部分地被观察到，并且在计算上很复杂。我们提出了第一个基于机器人状态-动作历史来推断社交动态的社交动态自适应模型（SDA）。我们提出了一个两阶段强化学习框架：第一阶段学习将人类轨迹编码为社交动态，并学习一个以编码信息、当前状态和先前动作为条件的运动策略。在这里，轨迹是完全可见的，即被认为是特权信息。在第二阶段，经过训练的策略在没有直接访问轨迹的情况下运行。相反，模型实时从先前动作和状态的历史中推断社交动态。在新的Habitat 3.0平台上进行测试，SDA在寻找和跟随人类方面取得了新的最先进的表现。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图解决机器人在社交导航中面临的问题，即如何实时适应人类运动，避免与人类碰撞，同时又要保持足够接近以提供帮助。
关键思路

论文提出了一种基于机器人状态-动作历史的社交动态自适应模型（SDA），用于推断社交动态。该模型采用两阶段强化学习框架，第一阶段学习将人类轨迹编码为社交动态，并在此基础上学习运动策略。第二阶段中，模型在没有直接访问轨迹的情况下，仅从先前动作和状态的历史中实时推断社交动态。
其它亮点

论文在Habitat 3.0平台上进行了实验，取得了新的最先进（SoA）性能，可以找到并跟随人类。该论文的主要贡献是提出了一种新的解决方案，即SDA模型，用于社交导航中机器人的实时适应。论文还提供了开源代码。
相关研究

在这个领域中，最近的相关研究包括：'Socially Aware Robot Navigation with Reinforcement Learning'、'Socially Interactive Navigation'等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问