【标题】First Contact: Unsupervised Human-Machine Co-Adaptation via Mutual Information Maximization
【作者团队】Siddharth Reddy, Sergey Levine, Anca D. Dragan
【发表日期】2022.9.15
【论文链接】https://arxiv.org/pdf/2205.12381v2.pdf
【推荐理由】如何训练辅助人机界面(例如,基于肌电图的假肢),将用户的原始命令信号转换为机器人或计算机的动作?本文的关键思想是,无论任务是什么,当界面更直观时,用户的命令噪音更小。并将该想法形式化为完全无监督的优化接口目标:用户命令信号和环境中诱导的状态转换之间的相互信息。为了评估这种互信息评分是否能够区分有效和无效界面,本文对540K个用户操作各种键盘和眼睛注视界面进行了观察研究,用户用于打字、控制模拟机器人和玩视频游戏。结果表明,互信息得分可以预测各种领域的基本真相任务完成指标,平均Spearman秩相关为0.43。并通过随机初始化接口,让用户尝试使用界面执行他们想要的任务,测量相互信息得分,通过强化学习更新界面以最大限度地提高相互信息。对12名参与者的用户研究来评估该方法,使用扰动的鼠标执行2D光标控制任务,以及一名用户使用手势玩Lunar Lander游戏的实验。结果表明,可以在30分钟内从零开始学习界面,无需任何用户监督或事先了解任务。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢