标题:UCB, CMU, 谷歌|Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents(作为零样本规划器的语言模型:为智能体提取可操作的知识)
作者:Wenlong Huang、Pieter Abbeel、Deepak Pathak、Igor Mordatch
简介:本文探索了大型语言模型 (LLM) 所学的世界知识用于互动环境行动。在本文中,作者研究了接地的可能性以自然语言表达的高级任务(例如“做早餐”),交给选定的人一组可操作的步骤(例如“打开冰箱”)。虽然之前的工作侧重于学习从如何行动的明确的分步示例中,作者惊奇地发现,如果预训练的LM足够大并适当提示,它们可以有效地无需任何进一步训练即可将高级任务分解为低级计划。然而,大语言模型天真地制定的计划往往无法准确地映射到可接受的行动。作者提出了一个以现有示范和在语义上将计划转换为可接受的行动。作者近期的评价VirtualHome 环境表明生成的方法显着提高在LLM基线上的可执行性。进行的人工评估揭示了一个可执行性和正确性之间的权衡,但显示出有希望的迹象从语言模型中提取可操作的知识。
代码下载:https://huangwl18.github.io/language-planner
论文地址:https://arxiv.org/pdf/2201.07207v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢