Imposing Exact Safety Specifications in Neural Reachable Tubes

2024年03月31日
  • 简介
    Hamilton-Jacobi(HJ)可达性分析是一种验证工具,为自主系统提供安全性和性能保证。由于它能够处理具有有界对抗扰动和状态和输入约束的非线性动态系统,因此被广泛采用。然而,它涉及解决PDE来计算安全值函数,其计算和内存复杂度随状态维数呈指数级增长,使其在大规模系统中的直接使用变得不可行。最近,提出了一种称为DeepReach的基于学习的方法,使用神经网络来逼近高维可达域。虽然DeepReach已被证明是有效的,但随着系统复杂性的增加,学习解的准确性会降低。其中一个原因是在学习过程中对安全约束的不精确施加,这对应于PDE的边界条件。具体而言,DeepReach将边界条件作为损失函数中的软约束施加,这在值函数学习过程中留下了误差的余地。此外,需要仔细调整边界条件和PDE施加在损失函数中的相对贡献。这反过来会在整体学习解中引入误差。在这项工作中,我们提出了DeepReach的一种变体,通过将整体值函数重构为边界条件和神经网络输出的加权和,精确施加安全约束来进行学习。这消除了培训期间边界损失的需求,从而避免了损失调整的需要。我们展示了所提出方法的有效性,显著提高了学习解的准确性,特别是在具有挑战性的高维可达性任务中,如火箭着陆和多车辆避撞问题。
  • 图表
  • 解决问题
    论文旨在解决Hamilton-Jacobi (HJ) reachability analysis在处理高维系统时的计算和存储复杂度过高的问题,提出了一种基于神经网络的解决方案DeepReach,并进一步改进其准确性。
  • 关键思路
    论文提出了一种改进版DeepReach,通过将整个价值函数重构为边界条件和神经网络输出的加权和来确切地实施安全约束,从而消除了训练过程中边界损失的需要,避免了损失调整的问题。
  • 其它亮点
    论文在挑战性的高维可达性任务中展示了所提出方法的有效性,如火箭着陆和多车辆避碰问题。实验设计合理,使用了多个数据集,并且提供了开源代码。
  • 相关研究
    相关研究包括:基于HJ可达性分析的验证工具、基于神经网络的可达性分析方法、深度学习在控制系统中的应用等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论