Sketch-Plan-Generalize: Continual Few-Shot Learning of Inductively Generalizable Spatial Concepts for Language-Guided Robot Manipulation

Namasivayam Kalithasan ,
Sachit Sachdeva ,
Himanshu Gaurav Singh ,
Divyanshu Aggarwal ,
Gurarmaan Singh Panjeta ,
Vishal Bindal ,
Arnav Tuli ,
Rohan Paul ,
Parag Singla
2024年04月11日
  • 简介
    我们的目标是建立具有体现形态的代理人,能够在连续的过程中归纳地学习可推广的空间概念,例如构建一个给定高度的塔。现有的工作存在某些限制:(a)(Liang等人,2023)及其多模态扩展在很大程度上依赖于先前的知识,并且没有基于演示的基础;(b)(Liu等人,2023)由于其纯神经方法,缺乏泛化的能力。一个关键挑战是在符号表示和神经表示之间实现良好的平衡,符号表示具有泛化能力,而神经表示则具有物理基础。为此,我们提出了一种神经符号方法,通过将归纳概念表达为基于有物理基础的神经概念的符号组合来实现。我们的关键见解是将概念学习问题分解为以下步骤:1)草图:为给定指令获取程序化表示;2)规划:通过对基于神经动作概念的序列进行基于模型的强化学习来学习有物理基础的规划;3)泛化:抽象出一种通用(提升的)Python程序,以促进泛化能力。通过将有物理基础的神经概念的学习与更高级别的符号结构相间隔,实现了连续学习。我们的实验表明,我们的方法在学习新概念和归纳泛化方面显著优于现有基线。
  • 图表
  • 解决问题
    论文的目标是构建具有体现特征的代理,能够以连续的方式归纳性地学习空间概念,例如构建给定高度的塔。现有的工作存在某些限制,例如依赖于先验知识且未基于演示的方法,或者由于其纯神经方法而缺乏泛化能力。
  • 关键思路
    论文提出了一种神经符号化方法,通过将归纳概念表达为基于基础神经概念的符号组合来解决问题。该方法将概念学习问题分解为以下步骤:1)草图:获取给定指令的程序化表示;2)计划:对基于神经行为概念序列的模型基础强化学习进行计划,以学习基础计划;3)泛化:抽象出一般的(提升的)Python程序,以促进泛化。通过将基于基础神经概念的学习与更高级别的符号构造相互穿插,实现了连续学习。
  • 其它亮点
    论文的实验表明,该方法在学习新概念和归纳泛化方面显著优于现有基线。实验使用了自己构建的数据集,并开源了代码。该方法的亮点在于将神经网络和符号推理相结合,实现了对物理世界的符号化表示和泛化能力。
  • 相关研究
    在这个领域中,最近的相关研究包括Liang等人的方法和他们的多模态扩展,以及Liu等人的方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论