Multi-Agent Behavior Retrieval

2023年12月04日
  • 简介
    本文旨在使多智能体系统能够有效地利用过去的记忆,以数据高效的方式适应新的协作任务。我们提出了多智能体协调技能数据库,用于存储与它们所特有的关键向量相关联的一组协调行为。我们基于Transformer的技能编码器有效地捕捉有助于协调的时空交互,并提供独特的技能表示形式,适用于每种协调行为。通过利用目标任务的少量演示,该数据库使我们能够使用检索到的演示数据来训练策略。实验评估清楚地表明,与少量模仿学习等基线方法相比,我们的方法在推动操作任务中实现了显著更高的成功率。此外,我们使用一组轮式机器人在真实环境中验证了我们的检索和学习框架的有效性。
  • 图表
  • 解决问题
    本文旨在使多智能体系统能够有效利用过去的记忆,以数据高效的方式适应新的协作任务。作者提出了多智能体协调技能数据库,用于存储与它们所特有的关键向量相关联的一组协调行为。
  • 关键思路
    本文的关键思路是使用Transformer-based技能编码器来有效捕捉有助于协调的时空交互,并为每个协调行为提供独特的技能表示。通过利用目标任务的少量演示,该数据库允许我们使用检索到的演示数据增强数据集来训练策略。
  • 其它亮点
    本文的亮点是在推动操作任务中取得了显着更高的成功率,相比于少样本模仿学习等基线方法。此外,作者还在使用一组轮式机器人的真实环境中验证了检索和学习框架的有效性。
  • 相关研究
    最近的相关研究包括《Few-Shot Adversarial Domain Adaptation》和《Learning to Learn from Demonstrations Using Signal Temporal Logic》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论