- 简介在共享环境中,人类和机器人之间的协作成功取决于机器人对人类运动的实时适应。特别是在社交导航中,机器人应该足够靠近以提供帮助,但又准备好退后以让人类自由移动,避免碰撞。人类轨迹在社交导航中成为关键线索,但是从机器人的自我中心视角来看,它们只能部分地被观察到,并且在计算上很复杂。我们提出了第一个基于机器人状态-动作历史来推断社交动态的社交动态自适应模型(SDA)。我们提出了一个两阶段强化学习框架:第一阶段学习将人类轨迹编码为社交动态,并学习一个以编码信息、当前状态和先前动作为条件的运动策略。在这里,轨迹是完全可见的,即被认为是特权信息。在第二阶段,经过训练的策略在没有直接访问轨迹的情况下运行。相反,模型实时从先前动作和状态的历史中推断社交动态。在新的Habitat 3.0平台上进行测试,SDA在寻找和跟随人类方面取得了新的最先进的表现。
-
- 图表
- 解决问题论文试图解决机器人在社交导航中面临的问题,即如何实时适应人类运动,避免与人类碰撞,同时又要保持足够接近以提供帮助。
- 关键思路论文提出了一种基于机器人状态-动作历史的社交动态自适应模型(SDA),用于推断社交动态。该模型采用两阶段强化学习框架,第一阶段学习将人类轨迹编码为社交动态,并在此基础上学习运动策略。第二阶段中,模型在没有直接访问轨迹的情况下,仅从先前动作和状态的历史中实时推断社交动态。
- 其它亮点论文在Habitat 3.0平台上进行了实验,取得了新的最先进(SoA)性能,可以找到并跟随人类。该论文的主要贡献是提出了一种新的解决方案,即SDA模型,用于社交导航中机器人的实时适应。论文还提供了开源代码。
- 在这个领域中,最近的相关研究包括:'Socially Aware Robot Navigation with Reinforcement Learning'、'Socially Interactive Navigation'等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流