描述、解释、计划和选择:使用大语言模型进行迭代式规划
标题:Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents
链接:https://arxiv.org/abs/2302.01560
作者:Zihao Wang1,2, Shaofei Cai1,2, Anji Liu3, Xiaojian Ma3, Yitao Liang1,4
单位:1 北京大学人工智能研究所。2 北京大学智能科学与技术学院,3 加州大学洛杉矶分校计算机科学系,4 北京通用人工智能研究所
摘要:
作者研究了「我的世界」中的规划问题,这是一个流行、民主但具有挑战性的开放式环境,用于开发多任务具体化代理。
用规划来授权这类代理有两个主要挑战:1)在像我的世界这样的开放世界中,由于任务的长期性质,规划需要精确和多步骤的推理;2)由于普通计划者在复杂计划中排序并行子目标时不考虑与当前代理的接近,结果计划可能效率低下。
作者提出了描述、解释、规划和选择(DEPS),这是一种基于大型语言模型(LLMS)的交互式规划方法。本文的方法有助于在长期计划期间从反馈中更好地纠正错误,同时还通过目标选择器带来接近感,目标选择器是一个可学习的模块,它基于估计的完成步骤对并行子目标进行排名,并相应地改进原始计划。本文的实验标志着第一个多任务代理的里程碑,它可以健壮地完成 70 多个我的世界任务,并且总体性能几乎翻了一番。最后,烧蚀和探索性研究详细说明了本文的设计如何击败同行,并通过我们的方法提供了关于 ObtainDiamond 重大挑战的有希望的更新。
代码地址:
https://github.com/CraftJarvis/MC-Planner
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢