论文标题:An Overview of Multi-agent Reinforcement Learning from Game Theoretical Perspective

论文地址:https://arxiv.org/pdf/2011.00583.pdf

论文简介: 继AlphaGO系列取得巨大成功之后,2019年是繁荣的一年,见证了多智能体强化学习(MARL)技术的重大进步。 MARL是一个跨学科的学科,拥有悠久的历史,包括博弈论,机器学习,随机控制,心理学和优化。尽管MARL在解决现实世界游戏方面取得了相当大的经验成功,但文献中缺乏一个完整的概述,无法阐述现代MARL方法的游戏理论基础并总结了最近的进展。实际上,大多数现有调查已过时,不能完全涵盖2010年以来的最新发展。在这项工作中,作者提供了有关MARL内容,其中涵盖了研究领域的基础知识和最新发展。工作分为两个部分。从§1到§4,介绍了MARL的基础知识,包括问题的表述,基本的解决方案和现有的挑战。具体来说,通过两个有代表性的框架(即随机博弈和广泛形式博弈)以及可以解决的不同博弈形式来介绍MARL公式。本部分的目的是使读者,即使是相关背景知识很少的读者,也能够掌握MAR​​L研究中的关键思想。从§5到§9,概述了MARL算法的最新发展。从针对MARL方法的新税法开始,对以前的调查文件进行了调查。在后面的部分中,将重点介绍MARL研究中的几个现代主题,包括Q函数分解,多智能体软学习,网络化多智能体MDP,随机潜在游戏,零和连续游戏,在线MDP,回合制随机游戏,策略空间响应预言,一般和博弈中的近似方法以及具有无限代理的博弈中的均值域类型学习。在每个主题中,作者选择最基本和最前沿的算法,专着的目的是从博弈论的角度对当前的最新MARL技术进行独立评估。最后希望这项工作将为即将进入这一快速增长领域的新研究人员和希望获得全景并根据最新进展确定新方向的现有领域专家充当垫脚石。

内容中包含的图片若涉及版权问题,请及时与我们联系删除