Mila - Quebec 人工智能研究所|通过智能通信渠道协调多个智能体之间的策略

【标题】Coordinating Policies Among Multiple Agents via an Intelligent Communication Channel

【作者团队】Dianbo Liu, Vedant Shah, Oussama Boussif, Cristian Meo, Anirudh Goyal

【发表日期】2022.5.21

【论文链接】https://arxiv.org/pdf/2205.10607.pdf

【推荐理由】在多智能体强化学习 (MARL) 中，通常会引入允许智能体直接相互交流的专用通道。本文提出了一种替代方法，即智能体通过智能协调者进行交流，该协调者学会筛选和解释所有智能体提供的信号，以提高智能体的集体表现。为了确保该协调者不会成为集中控制者，会激励智能体减少对它所传达的信息的依赖，并且这些信息只能影响从固定集合中选择策略，而不是给定策略的即时动作。本文在几个协作 MARL 环境中展示了该架构相对于现有基线的强度。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Mila - Quebec 人工智能研究所|通过智能通信渠道协调多个智能体之间的策略

评论列表

评论