Simultaneous System Identification and Model Predictive Control with No Dynamic Regret

2024年07月04日
  • 简介
    我们提供了一种用于非线性系统同时进行系统识别和模型预测控制的算法。该算法具有有限时间近似最优性保证,并渐进地收敛于最优(非因果)控制器。特别地,该算法享有次线性动态遗憾,本文定义为相对于一个最优的全知控制器的次优性,该控制器知道未知干扰和系统动态将如何适应其行动。该算法是自监督的,适用于具有未知动态和干扰的控制仿射系统,这些系统可以在再生核希尔伯特空间中表示。这样的空间可以模拟外部干扰和建模误差,甚至可以适应于系统的状态和控制输入。例如,它们可以模拟风和波对空中和海上车辆的干扰,或机械系统的惯性等不准确的模型参数。该算法首先生成用于逼近未知动态或干扰的随机傅里叶特征。然后,它基于当前学习到的未知动态(或干扰)模型,采用模型预测控制。未知动态的模型会使用最小二乘法基于控制系统收集的数据进行在线更新。我们在硬件实验和基于物理的仿真中验证了我们的算法。仿真包括(i)目标是维持杆子竖直的平衡车,尽管存在不准确的模型参数,和(ii)目标是跟踪参考轨迹的四旋翼,尽管存在未建模的气动阻力效应。硬件实验包括一个四旋翼,目标是尽管存在未建模的气动阻力效应、地面效应和风扰动,跟踪一个圆形轨迹。
  • 图表
  • 解决问题
    本论文旨在提出一种用于非线性系统同步系统识别和模型预测控制的算法,解决控制仿射系统中未知动态和干扰的问题。
  • 关键思路
    该算法基于随机傅里叶特征生成未知动态的近似模型,并使用模型预测控制策略来控制系统。算法具有有限时间近似最优性保证,能够收敛到最优(非因果)控制器。
  • 其它亮点
    该算法具有亚线性动态遗憾保证,能够自我监督地应用于具有未知动态和干扰的控制仿射系统。该算法的模型更新基于在线最小二乘法,能够适应系统的状态和控制输入。论文通过硬件实验和基于物理的模拟验证了该算法。
  • 相关研究
    近期的相关研究包括:'Learning-based MPC for Quadrotor Trajectory Tracking with Input Constraints','Data-Driven Model Predictive Control: A Survey','A Survey of Data-Driven Control: From Model-Based to Model-Free'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论