- 简介基于采样的模型预测控制(MPC)已经成为许多领域中实用且有效的方法,尤其是基于模型的强化学习,这得益于其灵活性和可并行性。尽管其具有吸引人的实证性能,但在收敛分析和超参数调整方面的理论理解仍然缺失。在本文中,我们表征了一种广泛使用的基于采样的MPC方法,模型预测路径积分控制(MPPI)的收敛性质。我们表明,当优化为二次型时,MPPI至少具有线性收敛速度,这涵盖了时变LQR系统。然后我们将其扩展到更一般的非线性系统。我们的理论分析直接导致了一种新的基于采样的MPC算法,协方差最优MPC(CoVo-MPC),该算法通过优化收敛速度来最优地调度采样协方差。从实证上讲,CoVo-MPC在模拟和实际四旋翼敏捷控制任务中的表现比标准MPPI提高了43-54%。视频和附录可在\url{https://lecar-lab.github.io/CoVO-MPC/}上获得。
- 图表
- 解决问题论文旨在解决采样型模型预测控制(MPC)方法的收敛性和超参数调整的理论理解问题,同时提出一种新的采样型MPC算法CoVariance-Optimal MPC(CoVo-MPC)
- 关键思路论文通过对广泛使用的采样型MPC方法Model Predictive Path Integral Control(MPPI)的收敛性进行分析,证明了在优化为二次型时具有至少线性收敛率,然后扩展到更一般的非线性系统,并提出了一种新的采样型MPC算法CoVo-MPC,该算法通过优化采样协方差来优化收敛速度
- 其它亮点论文提出的CoVo-MPC算法在模拟和实际四旋翼敏捷控制任务中均显著优于标准MPPI,提高了43-54%。论文提供了视频和附录。
- 相关研究包括采样型MPC方法的研究,以及模型预测控制和强化学习领域的研究。
沙发等你来抢
去评论
评论
沙发等你来抢