【标题】Toward reliable designs of data-driven reinforcement learning tracking control for Euler–Lagrange systems
【作者团队】Zhikai Yao, Ruofan Wu, Jianyong Yao
【发表日期】2022.6.3
【论文链接】https://www.sciencedirect.com/science/article/pii/S0893608022001915
【推荐理由】与线性系统的对应问题或调节控制问题不同,数据驱动的非线性最优跟踪控制问题非常具有挑战性。本文讨论了基于强化学习的直接信号跟踪控制,具体来说,旨在提供可靠且易于实施的设计,以实现可重现的基于神经网络的解决方案。本文提出的新设计利用了两个控制设计框架:基于强化学习的数据驱动方法来提供所需的适应和(次)最优性,以及基于反推的方法来提供闭环系统稳定性框架。作者为整个动态系统的稳定性、逼近非线性神经网络的权重收敛以及所得到的控制策略的贝尔曼(次)最优性提供了理论保证。逼近非线性神经网络的权重收敛,以及由此产生的控制策略的贝尔曼(次)最优性。作者使用模拟来证明所提出的方法相对于原始 dHDP 的设计性能显着提高。逼近非线性神经网络的权重收敛,以及由此产生的控制策略的贝尔曼(次)最优性。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢