Closing the gap: Optimizing Guidance and Control Networks through Neural ODEs

2024年04月25日
  • 简介
    我们改进了指导和控制网络(G&CNETs)的精度,这些网络被训练来表示最优控制策略,分别用于时间最优转移和质量最优着陆。在两种情况下,我们利用了航天器的动力学,该动力学由包含在其右侧的神经网络(神经ODEs)描述的常微分方程组成。由于神经动力学是可微分的,因此可以使用变分方程计算ODE对网络参数的灵敏度,从而基于观察到的动态更新G&CNET参数。我们从一个简单的回归任务开始,使用行为克隆在最优轨迹数据集上训练G&CNETs。然后,使用神经ODE的灵敏度来优化这些网络,通过最小化最终状态和目标状态之间的误差来实现。我们证明,在轨道转移中,单条轨迹的最终误差可以减少99%,500条轨迹的批处理误差可以减少70%。对于着陆问题,误差的减少约为98-99%(位置)和40-44%(速度)。这一步显著提高了G&CNETs的准确性,从而增强了它们在操作上的可靠性。我们还将结果与流行的数据集聚合方法(DaGGER)进行比较,并暗示了两种方法的优点和缺点。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在改进Guidance & Control Networks(G&CNETs)的准确性,以更可靠地用于操作。
  • 关键思路
    通过在航天器动力学中使用神经ODE,结合行为克隆和ODE灵敏度方法,优化G&CNETs的参数。
  • 其它亮点
    论文使用行为克隆和ODE灵敏度方法优化G&CNETs的参数,证明了这种方法可以显著提高G&CNETs的准确性。实验结果显示,对于轨道转移问题,单个轨迹的最终误差可以减少99%,批量500个轨迹可以减少70%。对于着陆问题,位置误差可以降低98-99%,速度误差可以降低40-44%。
  • 相关研究
    与Dataset Aggregation method(DaGGER)方法进行了比较,但并未提及其他相关研究。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问