【标题】Safe Reinforcement Learning Using Black-Box Reachability Analysis
【作者团队】Mahmoud Selim, Amr Alanwar, Shreyas Kousik, Grace Gao
【发表日期】2022.4.15
【论文链接】https://arxiv.org/pdf/2204.07417.pdf
【推荐理由】强化学习(RL)能够在不确定环境中对机器人进行复杂的运动规划和控制。然而,最先进的深度RL方法通常缺乏安全保证,尤其是在机器人和环境模型未知的情况下。为了证明广泛部署的合理性,机器人必须在不牺牲性能的情况下遵守安全约束。因此,本文提出了一种基于黑箱可达性的安全层(BRSL),它由三个主要部分组成:(1)黑箱机器人模型的数据驱动可达性分析,(2)使用在线训练的神经网络集合预测未来动作和观察的轨迹规划器,(3)可达集和障碍物之间的可微多面体碰撞检查,可以纠正不安全行为。在模拟中,BRSL在Turtlebot 3、四旋翼和轨迹跟踪点质量上优于其他最先进的安全RL方法,其中不安全集与最高奖励区域相邻。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢