Learning Control Barrier Functions and their application in Reinforcement Learning: A Survey

2024年04月22日
  • 简介
    强化学习是开发新机器人行为的强大技术。然而,缺乏安全保障常常成为其在实际机器人应用中的障碍。为了解决这个问题,安全强化学习旨在纳入安全考虑,使得更快地将其转移到实际机器人并促进终身学习。安全强化学习中的一种有前途的方法是使用控制屏障函数。这些函数提供了一个框架,确保系统在学习过程中保持安全状态。然而,合成控制屏障函数并不简单,通常需要充足的领域知识。这个挑战激发了对自动定义控制屏障函数的数据驱动方法的探索,这是非常有吸引力的。我们对使用控制屏障函数的安全强化学习的现有文献进行了全面的审查。此外,我们研究了各种技术,以自动学习控制屏障函数,旨在增强强化学习在实际机器人应用中的安全性和功效。
  • 作者讲解
  • 图表
  • 解决问题
    如何通过数据驱动的方法自动定义控制屏障函数以增强强化学习在实际机器人应用中的安全性和有效性?
  • 关键思路
    使用数据驱动的方法自动定义控制屏障函数,以确保系统在学习过程中保持安全状态,提高强化学习在实际机器人应用中的可行性和安全性。
  • 其它亮点
    论文综述了使用控制屏障函数的安全强化学习的现有文献,并调查了各种自动学习控制屏障函数的技术,包括深度学习和优化算法。实验使用了不同的机器人平台和数据集来验证方法的有效性。
  • 相关研究
    相关研究包括使用强化学习的机器人控制、使用控制屏障函数的安全控制、自动化控制设计和优化算法的研究。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问