ADaPT: As-Needed Decomposition and Planning with Language Models

2023年11月08日
  • 简介
    大型语言模型(LLMs)越来越多地被用于需要规划和适应环境的交互式决策任务。最近的研究使用LLMs作为代理的方式大致有两种:迭代确定下一步操作(迭代执行者)或使用LLMs生成计划并执行子任务(计划和执行)。然而,这些方法在处理任务复杂性时存在困难,因为无法执行任何子任务可能会导致任务失败。为了解决这些缺点,我们介绍了一种名为As-Needed Decomposition and Planning for complex Tasks(ADaPT)的方法,该方法明确地规划和分解复杂的子任务,即在LLM无法执行它们时需要进行分解。ADaPT递归地分解子任务以适应任务复杂性和LLM能力。我们的结果表明,ADaPT在ALFWorld中的成功率高达28.3%,在WebShop中为27%,在我们引入的新颖组合数据集TextCraft中为33%,明显优于已有的强基线。通过广泛的分析,我们阐明了多级分解的重要性,并确定了ADaPT动态调整执行者LLM的能力和任务复杂性的重要性。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决使用LLMs进行交互式决策任务时遇到的复杂性问题,提出了ADaPT方法来动态地规划和分解复杂的子任务,以适应LLMs的能力和任务复杂度。
  • 关键思路
    ADaPT方法通过逐步分解子任务来适应LLMs的能力和任务复杂度,实现了动态规划和分解复杂的任务。
  • 其它亮点
    ADaPT方法在三个数据集上的实验结果表明,其成功率比已有的强基线方法高出28.3%至33%。论文还介绍了TextCraft数据集,并探讨了多级分解的重要性。
  • 相关研究
    相关论文包括:1)Iterative Language-Based Action Sequence Prediction and Adaptation with Deep Reinforcement Learning,作者为Jiayi Weng等;2)Learning to Plan with Iterative Deep Model-Based Reinforcement Learning,作者为Danijar Hafner等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问