Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation

2025年04月27日
  • 简介
    在复杂环境中确保安全导航,需要精确的实时可通行性评估,以及对机器人能力相关的环境交互的理解。传统方法通常假设简化的动力学模型,往往需要设计和调整代价函数以安全地引导路径或动作到达目标。这一过程繁琐、依赖具体环境,且不具备通用性。为了解决这些问题,我们提出了一种全新的基于学习的感知前向动力学模型(FDM),该模型可以根据周围几何结构和历史本体感觉测量值预测机器人的未来状态,提供一种更具扩展性、更安全且无需启发式设计的解决方案。FDM 在多年模拟导航经验上进行训练,包括高风险操作和真实世界交互,从而超越刚体模拟,融入完整的系统动力学特性。我们将感知 FDM 集成到零样本模型预测路径积分(MPPI)规划框架中,利用所学习的动作、未来状态与失败概率之间的映射关系。这使得我们可以优化一个简化的代价函数,从而无需大量调整代价函数即可确保安全性。在足式机器人 ANYmal 上,所提出的感知 FDM 在位置估计方面平均比竞争性基线提高了 41%,这在粗糙模拟环境中转化为导航成功率提高了 27%。此外,我们展示了有效的从模拟到真实的迁移,并证明了在合成数据和真实数据上训练的好处。代码和模型已公开发布于 https://github.com/leggedrobotics/fdm。
  • 图表
  • 解决问题
    论文试图解决机器人在复杂环境中安全导航的问题,特别是如何准确评估环境的可通行性并结合机器人自身能力进行实时决策。这是一个长期存在的问题,但传统方法依赖于简化动态模型和繁琐的成本函数调优,难以泛化到不同环境。
  • 关键思路
    论文提出了一种基于学习的感知前向动力学模型(FDM),该模型能够预测机器人未来的状态,同时考虑周围几何结构和历史测量数据。与传统方法相比,FDM通过模拟和真实数据训练,捕捉了完整的系统动态,并集成到零样本Model Predictive Path Integral (MPPI) 规划框架中,从而优化简化的成本函数以确保安全性,无需手动调整复杂的成本项。
  • 其它亮点
    实验表明,在ANYmal机器人上,FDM将位置估计误差降低了41%,并在模拟粗糙环境中提高了27%的导航成功率。此外,论文展示了从仿真到实际应用的有效迁移,并证明了结合合成与真实数据训练的重要性。代码和模型已开源至https://github.com/leggedrobotics/fdm,为后续研究提供了坚实的基础。未来可以进一步探索更多复杂场景下的性能及与其他感知模块的融合。
  • 相关研究
    近期相关研究包括:1) "Learning to Walk via Deep Reinforcement Learning" 提出通过深度强化学习实现机器人步态控制;2) "End-to-End Navigation through Imitation and Reinforcement Learning" 探讨了模仿学习与强化学习结合的导航方法;3) "Safe Exploration for Robotics Using Learned Dynamics Models" 强调利用学习的动力学模型进行安全探索。这些研究共同推动了机器人在复杂环境中的自主导航能力。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论