作为一款极为经典的即时战略游戏,暴雪开发的《星际争霸II》也是强化学习训练最喜爱的训练环境之一。
尤其是在2019年DeepMind开发的AlphaStar和人类职业选手的大战之后,更是引发了一波热潮。
近日,北京大学的教授发表了一篇预印本研究论文,详细介绍了一个基于《星际争霸II》训练环境的强化学习系统。

论文地址:https://arxiv.org/pdf/2108.11010.pdf
项目地址:https://github.com/xunger99/SAAC-StarCraft-Adversary-Agent-Challenge
作者通过将控制和微分博弈理论纳入特定的强化学习环境来分析代理人的潜在表现,以及通过扩展当前的《星际争霸》小游戏进而开发了一个对抗性代理挑战(SAAC)的环境。
主要贡献有两个方面:
-
通过控制与博弈理论的结合,加强了对追逃博弈强化学习能力的理解;
-
提出了一个用于追逃博弈的对抗性代理强化学习环境,其设置逐渐复杂,并具有实际意义。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢