Long-Horizon Planning for Multi-Agent Robots in Partially Observable Environments

Siddharth Nayak ,
Adelmo Morrison Orozco ,
Marina Ten Have ,
Vittal Thirumalai ,
Jackson Zhang ,
Darren Chen ,
Aditya Kapoor ,
Eric Robinson ,
Karthik Gopalakrishnan ,
James Harrison ,
Brian Ichter ,
Anuj Mahajan ,
Hamsa Balakrishnan
29
热度
2024年07月14日
  • 简介
    语言模型(LMs)理解自然语言的能力使其成为将人类指令解析为自主机器人任务计划的强大工具。与依赖特定领域知识和手工规则的传统规划方法不同,LMs从多样化的数据中进行泛化,并通过最小调整适应各种任务,充当压缩的知识库。然而,标准形式的LMs在长期任务中面临挑战,特别是在部分可观察的多智能体环境中。我们提出了一种基于LM的多智能体机器人长期规划器(LLaMAR)的认知架构,它在部分可观察环境中实现了长期任务的最新成果。LLaMAR采用计划-执行-纠正-验证框架,允许根据行动执行反馈进行自我纠正,而不依赖于神谕或模拟器。此外,我们提出了MAP-THOR,一个包含各种复杂度家庭任务的全面测试套件,位于AI2-THOR环境中。实验表明,LLaMAR相比其他最先进的基于LM的多智能体规划器,成功率提高了30%。
  • 图表
  • 解决问题
    提出了一个基于语言模型的多智能体机器人长程规划的认知架构,旨在解决长程任务中的部分可观察多智能体环境中的挑战。
  • 关键思路
    提出了一个基于计划-执行-纠正-验证框架的认知架构,使得机器人可以在没有神谕或模拟器的情况下自我纠正。
  • 其它亮点
    提出了一个全面的测试套件MAP-THOR,其中包括AI2-THOR环境中的各种复杂度的家庭任务。实验表明,LLaMAR相比其他最先进的基于语言模型的多智能体规划器,成功率提高了30%。
  • 相关研究
    最近的相关研究包括“Multi-Agent Reinforcement Learning for Sequential Social Dilemmas”和“Learning Multi-Agent Communication with Backpropagation”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论