Learning to navigate efficiently and precisely in real environments

2024年01月25日
  • 简介
    在地面机器人自主导航的背景下,创造代理动力学和感知的真实模型是机器人学文献和商业应用中的普遍习惯,用于基于模型的控制和/或用于定位和制图。另一方面,最近的“具身化人工智能”文献侧重于在Habitat或AI-Thor等模拟器中训练模块化或端到端代理,强调的是逼真的渲染和场景多样性,但高保真度的机器人运动被赋予了较低的地位。由此产生的“模拟到真实”差距显著影响了将训练模型转移到实际机器人平台的能力。在这项工作中,我们探讨了在模拟中端到端训练代理的设置,这些设置在感知和执行中都最大程度地减小了“模拟到真实”差距。我们的代理直接预测(离散化的)速度命令,这些命令通过实际机器人中的闭环控制维持。实际机器人的行为(包括底层控制器)在修改后的Habitat模拟器中进行识别和模拟。里程计和定位的噪声模型进一步有助于降低“模拟到真实”差距。我们在真实导航场景中进行评估,探索不同的定位和点目标计算方法,并与之前的工作相比,报告了性能和鲁棒性的显著提高。
  • 图表
  • 解决问题
    论文探索在模拟环境中训练机器人智能体,并将其转移到真实机器人平台上的问题。特别是,论文着重解决了在感知和执行方面降低模拟到真实之间的差距。
  • 关键思路
    论文的关键思路是在模拟环境中训练机器人智能体,直接预测速度指令,并在真实机器人上进行闭环控制。同时,通过在模拟器中建立真实机器人的行为模型和噪声模型来降低模拟到真实之间的差距。
  • 其它亮点
    论文的实验设计涉及实际导航场景,探索了不同的定位和目标计算方法,并与之前的研究进行了比较。论文提出的方法在性能和稳健性方面都取得了显著的改进。此外,论文还使用了修改后的Habitat模拟器,并提供了开源代码。
  • 相关研究
    最近的相关研究包括使用不同的模拟器进行端到端训练的工作(如AI-Thor),以及使用模型预测控制的工作。例如,DeepMimic和Sim-to-Real Robot Learning from Pixels等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论