Integrating Disambiguation and User Preferences into Large Language Models for Robot Motion Planning

2024年04月22日
  • 简介
    本文提出了一个框架,能够解释包含时间元素的人类导航指令,并直接将其自然语言指令转化为机器人运动规划。该框架的核心是利用大型语言模型(LLMs)。为了增强框架中LLMs的可靠性,改善用户体验,我们提出了解决自然语言指令中歧义和捕捉用户偏好的方法。该过程始于一个歧义分类器,识别指令中可能存在的不确定性。歧义语句会触发一个基于GPT-4的机制,生成澄清问题,并结合用户的回答进行消歧。此外,该框架评估并记录用户对于非歧义指令的偏好,增强未来的交互。该过程的最后一部分是将消歧后的指令翻译成机器人运动计划,使用线性时态逻辑。本文详细介绍了该框架的开发以及在各种测试场景下的性能评估。
  • 图表
  • 解决问题
    论文旨在开发一个框架,可以将人类导航指令中的时间元素解释为机器人运动规划,解决自然语言指令的模糊性问题。
  • 关键思路
    该框架利用大型语言模型(LLMs)来解释自然语言指令,通过模糊性分类器和GPT-4生成澄清问题来解决指令中的模糊性问题,并使用线性时间逻辑将澄清后的指令转化为机器人运动规划。
  • 其它亮点
    论文提出的框架可以提高自然语言指令的可靠性和用户体验,实验结果表明该框架在不同测试场景下的表现良好。论文还介绍了解决模糊性问题和捕捉用户偏好的方法,并提供了开源代码。
  • 相关研究
    最近的相关研究包括使用深度学习模型解释自然语言指令的方法和使用线性时间逻辑将指令转化为机器人运动规划的方法。例如,"Natural Language Understanding for Robotics: A Review"和"Temporal logic motion planning for mobile robots"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论