MLDT: Multi-Level Decomposition for Complex Long-Horizon Robotic Task Planning with Open-Source Large Language Model

2024年03月27日
  • 简介
    在数据驱动的人工智能技术领域,开源大型语言模型(LLMs)在机器人任务规划中的应用代表了一个重要的里程碑。基于开源LLMs的最近的机器人任务规划方法通常利用大量的任务规划数据集来增强模型的规划能力。虽然这些方法显示出了很大的潜力,但是它们在需要理解更多上下文并生成更长的动作序列的复杂长期任务方面仍然存在困难。本文通过提出多级分解任务规划方法(MLDT)来解决这一限制。该方法在目标级别、任务级别和动作级别上创新地分解任务,以缓解复杂长期任务的挑战。为了增强开源LLMs的规划能力,我们引入了一个目标敏感的语料库生成方法,以创建高质量的训练数据,并对生成的语料库进行指导调整。由于现有数据集的复杂性不够高,我们构建了一个更具挑战性的数据集LongTasks,专门评估复杂长期任务的规划能力。我们使用各种LLMs在VirtualHome的四个数据集上评估了我们的方法。我们的结果展示了机器人任务规划性能的显著提升,展示了MLDT在克服基于开源LLMs的现有方法的限制以及在复杂的现实场景中的实用性。
  • 图表
  • 解决问题
    解决复杂长程任务规划的挑战,提高开源大型语言模型在机器人任务规划中的应用能力。
  • 关键思路
    提出了一种多级分解任务规划方法(MLDT),在目标层次、任务层次和动作层次上进行任务分解,以缓解复杂长程任务规划的挑战。同时,引入了目标敏感的语料库生成方法,以提高训练数据的质量和对开源大型语言模型的规划能力进行指导调整。
  • 其它亮点
    使用虚拟家庭中的四个数据集评估了MLDT方法的性能,证明了其在机器人任务规划中的有效性和实用性,并提出了一个更具挑战性的数据集LongTasks。值得关注的是,该论文的方法在解决复杂长程任务规划方面具有创新性。
  • 相关研究
    相关研究包括基于深度学习的机器人任务规划方法,如基于强化学习的方法和基于模型的方法。其中一些研究包括:'End-to-End Robotic Reinforcement Learning without Reward Engineering'和'Learning to Navigate Unseen Environments: Back Translation with Environmental Dropout'。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论