Improving Out-of-Distribution Generalization of Learned Dynamics by Learning Pseudometrics and Constraint Manifolds

2024年03月18日
  • 简介
    我们提出了一种方法来提高机器人动力学模型在分布外(OOD)状态下的预测准确性。我们通过利用机器人动力学中经常存在的两个关键结构来实现这一目标:1)稀疏性,即状态的某些组成部分可能不会影响动力学;2)可能运动的物理限制,以非完整约束的形式表现。关键是,我们不假定这种结构是先验已知的,而是从数据中学习它。我们使用对比学习来获得一个距离伪度量,以揭示动力学中的稀疏模式,并在学习动力学时使用它来减少输入空间。然后,我们通过从数据中近似可能运动的法向空间来学习未知的约束流形,我们使用它来训练约束流形的高斯过程(GP)表示。我们在一个物理差分驱动机器人和一个模拟的四旋翼上评估了我们的方法,相对于基线,显示了OOD数据上的改进的预测准确性。
  • 图表
  • 解决问题
    提高机器人动力学模型在分布外状态下的预测精度。
  • 关键思路
    通过学习机器人动力学中的稀疏性和非完整约束等结构,提高机器人动力学模型在分布外状态下的预测精度。
  • 其它亮点
    使用对比学习获取距离伪度量,减少输入空间;通过数据近似学习未知的约束流形,训练高斯过程表示的约束流形;在实际差分驱动机器人和模拟四旋翼上进行实验,相对于基线方法展示了更好的预测精度。
  • 相关研究
    近期的相关研究包括:《Deep Reinforcement Learning for Vision-Based Robotic Grasping: A Simulated Comparative Evaluation of Off-Policy Methods》、《Learning to Control Self-Assembling Morphologies: A Study of Generalization via Modularity》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论