- 简介游戏被广泛用作多智能体强化学习(MARL)研究环境,但它们存在三个重大挑战:定制性有限、计算需求高和过度简化。为了解决这些问题,我们介绍了流行手机游戏《王者荣耀》的第一个公开地图编辑器,并设计了一个轻量级环境Mini Honor of Kings(Mini HoK),供研究人员进行实验。Mini HoK非常高效,可以在个人PC或笔记本电脑上运行实验,同时对于现有的MARL算法仍然具有足够的挑战性。我们已经在常见的MARL算法上测试了我们的环境,并证明这些算法在此环境中尚未找到最优解决方案。这有助于在研究社区内传播和推进MARL方法的发展。此外,我们希望更多的研究人员利用《王者荣耀》地图编辑器开发创新和具有科学价值的新地图。我们的代码和用户手册可在以下网址获得:https://github.com/tencent-ailab/mini-hok。
- 图表
- 解决问题本论文旨在解决多智能体强化学习(MARL)中游戏环境的三个挑战:定制性受限、计算需求高、过于简化。通过引入可公开使用的《王者荣耀》地图编辑器和设计一个轻量级环境Mini HoK,该论文试图解决这些问题。
- 关键思路本论文的关键思路是通过引入可公开使用的《王者荣耀》地图编辑器和设计一个轻量级环境Mini HoK,来解决MARL中游戏环境的三个挑战。Mini HoK高效,可在个人PC或笔记本电脑上运行实验,并为现有的MARL算法提供足够的挑战。
- 其它亮点本论文的亮点包括:引入可公开使用的地图编辑器,设计了一个轻量级环境Mini HoK,实验高效,可在个人PC或笔记本电脑上运行,对现有的MARL算法提供了足够的挑战。该论文的代码和用户手册可在https://github.com/tencent-ailab/mini-hok上获取。
- 最近在这个领域中,还有一些相关的研究被进行,例如《Multi-Agent Reinforcement Learning: A Selective Overview of Theories and Algorithms》、《Emergence of Grounded Compositional Language in Multi-Agent Populations》等。
沙发等你来抢
去评论
评论
沙发等你来抢