【标题】High Performance Simulation for Scalable Multi-Agent Reinforcement Learning
【作者团队】Jordan Langham-Lopez, Sebastian M. Schmon, Patrick Cannon
【发表日期】2022.7.8
【论文链接】https://arxiv.org/pdf/2207.03945.pdf
【推荐理由】多智能体强化学习实验和开源训练环境通常规模有限,支持数十甚至数百个交互智能体。 本文演示了 Vogue 的使用,这是一个高性能的基于智能体的模型 (ABM) 框架。 Vogue 用作多智能体训练环境,支持成千上万的交互智能体,同时通过在 GPU 上运行环境和强化学习 (RL) 智能体来保持高训练吞吐量。 这种规模的高性能多智能体环境有可能学习健壮和灵活的策略,用于 ABM 和复杂系统的模拟。 作者通过两个新开发的大规模多智能体训练环境展示了训练性能。 此外,本文表明这些环境可以在几分钟和几小时的时间尺度上训练共享 RL 策略。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢