OGMP: Oracle Guided Multimodal Policies for Agile and Versatile Robot Control

简介

在实现令人印象深刻的实验结果的任务特定的基于学习的控制合成框架中，缺乏一个系统构建优化策略以足够解决一般任务概念的统一框架。因此，我们提出了一个基于任务的控制合成的理论框架，利用两个关键思想：1）引导策略优化的神谕指导，以便于将次优的基于任务的先验知识无限制地集成到策略优化中；2）任务重要的多模态性，将解决任务分解为执行一系列行为模式。该方法在一个16自由度动态双足机器人上实现了高度灵活的跑酷和跳水。所得到的策略可以无限地在跑道上前进，执行各种长度和高度的跳跃。相对应于跳水任务，该策略展示了各种起始高度的前空翻、后空翻和侧空翻。最后，我们引入了一种新颖的潜在模式空间可达性分析，通过计算一个可行模式集函数来研究我们的策略的多功能性和泛化性，通过这个函数我们可以证明我们的策略可以在任何给定的状态下执行一组无故障的模式。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

提出一个任务中心的控制综合理论框架，解决当前缺乏一个系统构建足够解决任务的最优策略的问题。
关键思路

利用神谕引导的策略优化和任务关键的多模态来构建任务中心的控制综合理论框架。
其它亮点

在16自由度动态双足机器人上进行实验，实现高度灵活的跑酷和跳水任务，提出了一种新的潜在模式空间可达性分析方法，证明了策略的多功能性和泛化性。
相关研究

在此领域的相关研究包括：《Reinforcement Learning for Robust Parameterized Control Policies》、《Robust Control of Uncertain Nonlinear Systems: A Learning-Based Approach》等。

OGMP: Oracle Guided Multimodal Policies for Agile and Versatile Robot Control

提问交流

提问交流