【论文标题】On Passivity, Reinforcement Learning and Higher-Order Learning in Multi-Agent Finite Games多智能体有限游戏中的被动性,强化学习和高阶学习

【作者团队】Bolin Gao, Lacra Pavel

【发表时间】2021-1-1

【论文链接】https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9022871

【推荐理由】文章提出了一种基于被动性的方法来分析和设计多智能体有限博弈中的强化学习动力学算法。从已知的一阶强化学习方案开始,文章证明,与以前文献中所考虑的相比,在更广泛的游戏类别中可以达到Nash分布的收敛,即以(负)单调性为特征的游戏回报向量。文章进一步利用无源技术来设计一类高阶学习方案,以保留其一阶对应项的收敛性。此外,文章表明,高阶方案可以提高收敛速度,甚至可以在一阶方案失败的情况下实现收敛。

内容中包含的图片若涉及版权问题,请及时与我们联系删除