- 简介Embodied Instruction Following(EIF)是通过在3D环境中导航和与物体交互来执行自然语言指令的任务。EIF的主要挑战之一是组合任务规划,通常使用带标签数据的监督或上下文学习来解决。为此,我们介绍了Socratic Planner,这是第一个无需任何训练数据即可推断的零样本规划方法。Socratic Planner首先通过自问自答将指令分解为任务的子结构信息,将其转化为高级计划,即子目标序列。子目标按顺序执行,我们的视觉基础重新规划机制通过密集的视觉反馈动态调整计划。我们还引入了高级计划的评估指标RelaxedHLP,以进行更全面的评估。实验表明,Socratic Planner的有效性,在ALFRED基准测试中实现了零样本和少样本任务规划的竞争性表现,尤其在需要高维推理的任务中表现出色。此外,通过将环境视觉信息纳入考虑,实现了计划的精确调整。
- 图表
- 解决问题Socratic Planner是一种零样本计划方法,用于执行自然语言指令并与三维环境中的对象进行交互。该论文旨在解决EIF中的组合任务规划问题,提出了一种不需要任何训练数据的零样本计划方法。
- 关键思路Socratic Planner通过自问自答将指令分解为任务的子结构信息,将其转化为高级计划,即子目标序列。通过密集的视觉反馈,顺序执行子目标,并使用基于视觉的重新规划机制动态调整计划。
- 其它亮点论文提出了一种新的零样本计划方法,避免了需要大量标注数据的问题。实验结果表明,Socratic Planner在ALFRED基准测试中取得了竞争性的性能,并在需要更高维推理的任务中表现出色。论文还引入了一种评估高级计划的指标RelaxedHLP。
- 与本论文相关的研究包括使用监督学习或有标签数据的上下文学习来解决EIF中的组合任务规划问题的先前工作。
沙发等你来抢
去评论
评论
沙发等你来抢