【标题】Coordinating Policies Among Multiple Agents via an Intelligent Communication Channel
【作者团队】Dianbo Liu, Vedant Shah, Oussama Boussif, Cristian Meo, Anirudh Goyal
【发表日期】2022.5.21
【论文链接】https://arxiv.org/pdf/2205.10607.pdf
【推荐理由】在多智能体强化学习 (MARL) 中,通常会引入允许智能体直接相互交流的专用通道。本文提出了一种替代方法,即智能体通过智能协调者进行交流,该协调者学会筛选和解释所有智能体提供的信号,以提高智能体的集体表现。为了确保该协调者不会成为集中控制者,会激励智能体减少对它所传达的信息的依赖,并且这些信息只能影响从固定集合中选择策略,而不是给定策略的即时动作。本文在几个协作 MARL 环境中展示了该架构相对于现有基线的强度。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢