- 简介游戏被广泛用作多智能体强化学习(MARL)的研究环境,但它们存在三个重要挑战:定制性有限、计算需求高和过于简化。为了解决这些问题,我们介绍了流行移动游戏《王者荣耀》的第一个公开地图编辑器,并设计了一个轻量级环境Mini Honor of Kings(Mini HoK),供研究人员进行实验。Mini HoK非常高效,可以在个人PC或笔记本电脑上运行实验,同时仍然提供足够的挑战,适用于现有的MARL算法。我们已经在常见的MARL算法上测试了我们的环境,并证明这些算法在此环境中还没有找到最优解。这有助于在研究社区内传播和推进MARL方法的发展。此外,我们希望更多的研究人员利用《王者荣耀》地图编辑器开发创新和具有科学价值的新地图。我们的代码和用户手册可以在以下网址找到:https://github.com/tencent-ailab/mini-hok。
- 图表
- 解决问题设计一个高效的、可定制的多智能体强化学习环境,以解决游戏环境中存在的限制、计算需求高和过度简化等挑战。
- 关键思路通过开发一个基于Honor of Kings游戏的地图编辑器,设计了一个轻量级环境Mini HoK,使研究人员能够在个人PC或笔记本电脑上运行实验,同时仍然面临足够的挑战。
- 其它亮点Mini HoK是高效的,有助于传播和推进多智能体强化学习方法在研究社区中的应用。作者还希望更多的研究人员能够利用Honor of Kings地图编辑器开发创新性和科学价值的新地图。作者提供了代码和用户手册。
- 最近的相关研究主要集中在多智能体强化学习的算法和应用上,例如《Multi-Agent Reinforcement Learning: A Selective Overview of Theories and Algorithms》和《Emergence of Grounded Compositional Language in Multi-Agent Populations》。
沙发等你来抢
去评论
评论
沙发等你来抢