【标题】Multi-Modal Mutual Information (MuMMI) Training for Robust Self-Supervised Deep Reinforcement Learning
【作者团队】Kaiqi Chen, Yong Lee, Harold Soh
【发表日期】2021.7.6
【论文链接】https://arxiv.org/pdf/2107.02339.pdf
【推荐理由】这项工作的重点是使用多个可能不可靠的传感器来学习有用且强大的深度世界模型。本文们发现当前的方法不足以鼓励模态之间的共享表示;这可能会导致下游任务的性能不佳以及过度依赖特定传感器。作为解决方案,本文贡献了一个新的多模态深度潜在状态空间模型,使用互信息下界进行训练。关键创新是一个特别设计的密度比估计器,它鼓励每种模式的潜在代码之间的一致性。本文将该方法在多模态自然 MuJoCo 基准和具有挑战性的 Table Wiping 任务上学习策略(以自我监督的方式)。实验表明了该方法明显优于最先进的深度强化学习方法,尤其是在缺少观察的情况下。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢