Closing the gap: Optimizing Guidance and Control Networks through Neural ODEs

简介

我们改进了指导和控制网络（G&CNETs）的精度，这些网络被训练来表示最优控制策略，分别用于时间最优转移和质量最优着陆。在两种情况下，我们利用了航天器的动力学，该动力学由包含在其右侧的神经网络（神经ODEs）描述的常微分方程组成。由于神经动力学是可微分的，因此可以使用变分方程计算ODE对网络参数的灵敏度，从而基于观察到的动态更新G&CNET参数。我们从一个简单的回归任务开始，使用行为克隆在最优轨迹数据集上训练G&CNETs。然后，使用神经ODE的灵敏度来优化这些网络，通过最小化最终状态和目标状态之间的误差来实现。我们证明，在轨道转移中，单条轨迹的最终误差可以减少99％，500条轨迹的批处理误差可以减少70％。对于着陆问题，误差的减少约为98-99％（位置）和40-44％（速度）。这一步显著提高了G&CNETs的准确性，从而增强了它们在操作上的可靠性。我们还将结果与流行的数据集聚合方法（DaGGER）进行比较，并暗示了两种方法的优点和缺点。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在改进Guidance & Control Networks（G&CNETs）的准确性，以更可靠地用于操作。
关键思路

通过在航天器动力学中使用神经ODE，结合行为克隆和ODE灵敏度方法，优化G&CNETs的参数。
其它亮点

论文使用行为克隆和ODE灵敏度方法优化G&CNETs的参数，证明了这种方法可以显著提高G&CNETs的准确性。实验结果显示，对于轨道转移问题，单个轨迹的最终误差可以减少99％，批量500个轨迹可以减少70％。对于着陆问题，位置误差可以降低98-99％，速度误差可以降低40-44％。
相关研究

与Dataset Aggregation method（DaGGER）方法进行了比较，但并未提及其他相关研究。

Closing the gap: Optimizing Guidance and Control Networks through Neural ODEs

提问交流

提问交流