【标题】Data-Efficient Off-Policy Learning for Distributed Optimal Tracking Control of HMAS With Unidentified Exosystem Dynamics
【作者团队】Yong Xu , Zheng-Guang Wu
【发表日期】2022.5.20
【论文链接】https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9779315
【推荐理由】本文提出了一种数据高效的离线策略强化学习 (RL) 方法,用于使用近似动态规划 (ADP) 对异构多智能体系统 (HMAS) 进行分布式输出跟踪控制。与外系统的运动学模型可寻址到部分或所有智能体的现有结果不同,本文假设外系统的动力学对于所有智能体都是完全未知的。为了解决这个难题,为智能体设计了使用经验重放方法的可识别算法,以识别新参考模型的系统矩阵。然后提出了一种基于输出的分布式自适应输出观察器来提供领导者的估计。此外,给出了一种数据高效的 RL 算法来离线设计最优控制器以及系统轨迹,而无需求解输出调节器方程。开发了一种 ADP 方法,利用在线状态信息和在线输入迭代求解博弈代数 Riccati 方程 (GARE),从而放宽了对先验知识的要求。最后通过数值算例验证了理论分析的有效性。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢