Risk-Calibrated Human-Robot Interaction via Set-Valued Intent Prediction

简介

这篇文章讨论了机器人与人类合作的任务，如在杂乱的家庭环境中导航或分类日常物品等，这些任务具有多种有效的行动方案，可以导致类似的结果，因此很具有挑战性。此外，零-shot合作是一个特别具有挑战性的问题，因为它需要机器人推断和适应潜在的人类意图，并且这些意图可能因人而异。最近，深度学习的运动预测模型在预测人类意图方面表现出了很好的效果，但它们容易出现自信错误。在这项工作中，我们提出了“风险校准交互规划（RCIP）”框架，用于测量和校准与人机合作中不确定行动选择相关的风险，其基本思想是当机器人无法控制人类意图的不确定性风险时，机器人应该请求人类澄清。RCIP基于集合值风险校准理论，提供了有限样本统计保证，同时在复杂的多步设置中最小化人类澄清成本时，构建了一个与不确定性行动选择相关的风险控制问题。我们的主要见解是将风险控制问题框架化为序列级多假设测试问题，从而利用低维参数对预训练的风险感知策略进行高效的校准。在各种模拟和实际环境中进行的实验表明，RCIP能够预测和适应多样化的动态人类意图。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

RCIP框架旨在解决机器人与人类合作中的不确定性问题，特别是在需要零-shot合作的情况下。该论文提出的方案旨在通过测量和校准风险来控制不确定性，从而最小化人类澄清的成本。
关键思路

RCIP将风险控制问题视为序列级多假设测试问题，使用一个低维参数控制预训练的风险感知策略，从而提供有效的风险校准。
其它亮点

该论文的亮点在于提出了一种新的框架来解决机器人与人类合作中的不确定性问题，并提供了一种有效的风险校准方法。实验结果表明，RCIP框架可以适应不同的动态人类意图，并在多个环境中进行了测试。
相关研究

在这个领域的相关研究包括“DeepMimic：用于物理模拟的深度增强学习和控制”的论文，以及“预测人类行为的深度学习模型”的论文。

Risk-Calibrated Human-Robot Interaction via Set-Valued Intent Prediction

提问交流

提问交流