Multi-Agent Continuous Control with Generative Flow Networks

2024年08月13日
  • 简介
    本文介绍了一种名为多智能体生成连续流网络(MACFN)的新方法,旨在解决生成流网络(GFlowNets)在多智能体系统中的应用限制问题。MACFN通过训练分散的基于个体流的策略,以集中的全局流匹配方式,从而使多个智能体能够在连续的联合控制问题中进行协作探索。在训练过程中,MACFN引入了连续流分解网络,以推导出每个智能体的流贡献,从而形成与奖励成比例的联合策略分布。为了保证连续流分解的表达能力,本文理论上推导了分解网络的一致性条件。实验结果表明,与现有方法相比,该方法具有更好的探索能力和更优异的性能。
  • 作者讲解
  • 图表
  • 解决问题
    MACFN论文旨在解决GFlowNets在多智能体系统中应用受限的问题,提出了一种新的方法,使多个智能体能够在连续的联合控制问题中进行合作探索。
  • 关键思路
    MACFN通过在集中式全局流匹配的方式下训练分散的基于个体流的策略,使智能体能够根据其分配的本地流进行行动,形成与奖励成比例的联合策略分布。
  • 其它亮点
    该论文提出了一种新的方法来解决多智能体系统中的合作探索问题,同时提高了探索能力。论文通过理论推导得出了连续流分解的一致性条件。实验结果表明,该方法优于现有的对手和自我对抗方法,并且在各种数据集上进行了测试。代码已在GitHub上开源。
  • 相关研究
    在最近的相关研究中,有一些与MACFN类似的方法,如GFlowNets和自我对抗方法。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问