- 简介在多房间环境中进行物品重新排列应该产生一个合理的计划,以减少代理的总行程和步数。最近的最先进方法未能产生这样的计划,因为它们依赖于显式探索来发现由于部分可观察性而未见的对象,并使用启发式计划器来对重新排列的动作进行排序。本文提出了一种新的分层任务规划器,以高效地规划一系列动作,以发现未见的对象并重新排列杂乱无序房屋中的物品,以达到期望的整洁状态。所提出的方法引入了几种新技术,包括:(i)一种使用大型语言模型中的常识知识来发现未见对象的方法,(ii)一种基于交叉熵方法的碰撞解决和缓冲区预测方法,以处理被阻塞的目标和交换情况,(iii)一种基于有向空间图的状态空间,以实现可扩展性,以及(iv)深度强化学习(RL)以产生高效的规划器。规划器交替发现未见对象和重新排列,以最小化代理的步数和总遍历次数。本文还提出了新的度量标准和一个名为MoPOR的基准数据集,以评估多房间环境中重新排列规划的有效性。实验结果表明,所提出的方法有效地解决了多房间重新排列问题。
- 图表
- 解决问题解决问题:论文试图解决多房间物体重新排列的问题,如何在减少智能体移动步数和总步骤数的情况下生成合理的计划。
- 关键思路关键思路:论文提出了一种新的层次任务规划器,通过使用大型语言模型的常识知识来发现未见过的物体,基于交叉熵方法的冲突解决和缓冲区预测方法来处理被阻塞的目标和交换情况,使用基于有向空间图的状态空间来实现可扩展性,使用深度强化学习(RL)生成高效规划器。
- 其它亮点其他亮点:论文提出了一个名为MoPOR的基准数据集和新的度量标准来评估多房间重新排列规划的有效性。实验结果表明,所提出的方法有效地解决了多房间重新排列问题。
- 相关研究:最近的相关研究包括“Multi-Robot Object Rearrangement with Spatial Relations and Semantic Knowledge”和“Efficient Multi-Robot Task Allocation for Object Rearrangement in Cluttered Environments”。
沙发等你来抢
去评论
评论
沙发等你来抢