ADaPT: As-Needed Decomposition and Planning with Language Models

简介

大型语言模型（LLMs）越来越多地被用于需要规划和适应环境的交互式决策任务。最近的研究使用LLMs作为代理的方式大致有两种：迭代确定下一步操作（迭代执行者）或使用LLMs生成计划并执行子任务（计划和执行）。然而，这些方法在处理任务复杂性时存在困难，因为无法执行任何子任务可能会导致任务失败。为了解决这些缺点，我们介绍了一种名为As-Needed Decomposition and Planning for complex Tasks（ADaPT）的方法，该方法明确地规划和分解复杂的子任务，即在LLM无法执行它们时需要进行分解。ADaPT递归地分解子任务以适应任务复杂性和LLM能力。我们的结果表明，ADaPT在ALFWorld中的成功率高达28.3％，在WebShop中为27％，在我们引入的新颖组合数据集TextCraft中为33％，明显优于已有的强基线。通过广泛的分析，我们阐明了多级分解的重要性，并确定了ADaPT动态调整执行者LLM的能力和任务复杂性的重要性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决使用LLMs进行交互式决策任务时遇到的复杂性问题，提出了ADaPT方法来动态地规划和分解复杂的子任务，以适应LLMs的能力和任务复杂度。
关键思路

ADaPT方法通过逐步分解子任务来适应LLMs的能力和任务复杂度，实现了动态规划和分解复杂的任务。
其它亮点

ADaPT方法在三个数据集上的实验结果表明，其成功率比已有的强基线方法高出28.3%至33%。论文还介绍了TextCraft数据集，并探讨了多级分解的重要性。
相关研究

相关论文包括：1）Iterative Language-Based Action Sequence Prediction and Adaptation with Deep Reinforcement Learning，作者为Jiayi Weng等；2）Learning to Plan with Iterative Deep Model-Based Reinforcement Learning，作者为Danijar Hafner等。

ADaPT: As-Needed Decomposition and Planning with Language Models

提问交流

提问交流