- 简介大型语言模型(LLMs)越来越多地被用于需要规划和适应环境的交互式决策任务。最近的研究使用LLMs作为代理的方式大致有两种:迭代确定下一步操作(迭代执行者)或使用LLMs生成计划并执行子任务(计划和执行)。然而,这些方法在处理任务复杂性时存在困难,因为无法执行任何子任务可能会导致任务失败。为了解决这些缺点,我们介绍了一种名为As-Needed Decomposition and Planning for complex Tasks(ADaPT)的方法,该方法明确地规划和分解复杂的子任务,即在LLM无法执行它们时需要进行分解。ADaPT递归地分解子任务以适应任务复杂性和LLM能力。我们的结果表明,ADaPT在ALFWorld中的成功率高达28.3%,在WebShop中为27%,在我们引入的新颖组合数据集TextCraft中为33%,明显优于已有的强基线。通过广泛的分析,我们阐明了多级分解的重要性,并确定了ADaPT动态调整执行者LLM的能力和任务复杂性的重要性。
-
- 图表
- 解决问题论文旨在解决使用LLMs进行交互式决策任务时遇到的复杂性问题,提出了ADaPT方法来动态地规划和分解复杂的子任务,以适应LLMs的能力和任务复杂度。
- 关键思路ADaPT方法通过逐步分解子任务来适应LLMs的能力和任务复杂度,实现了动态规划和分解复杂的任务。
- 其它亮点ADaPT方法在三个数据集上的实验结果表明,其成功率比已有的强基线方法高出28.3%至33%。论文还介绍了TextCraft数据集,并探讨了多级分解的重要性。
- 相关论文包括:1)Iterative Language-Based Action Sequence Prediction and Adaptation with Deep Reinforcement Learning,作者为Jiayi Weng等;2)Learning to Plan with Iterative Deep Model-Based Reinforcement Learning,作者为Danijar Hafner等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流