【标题】Mastering the game of Stratego with model-free multiagent reinforcement learning

【作者团队】Julien Perolat, Bart De Vylder, Daniel Hennes, Eugene Tarassov, Florian Strub, Vincent de Boer, Paul Muller, Jerome T. Connor, Neil Burch, Thomas Anthony等

【发表日期】2022.12.01

【论文链接】https://www.science.org/doi/epdf/10.1126/science.add4679

【推荐理由】近期,Science上发表了DeepMind的一篇AI玩转西洋陆军棋(Stratego)的论文,引发关注。Stratego是一种不完全信息博弈,需要像国际象棋一样的长期战略思考,但它也需要像打扑克一样处理不完美的信息,因此是人工智能 (AI) 尚未掌握的少数标志性棋盘游戏之一。

DeepMind 团队介绍了 DeepNash 这一自主智能体,利用博弈论、无模型的深度强化学习方法,无需搜索,通过从头开始的自我对弈来学习掌握 Stratego。DeepNash成功地展示了,AI如何在不确定的情况下,完美地平衡了结果,解决了复杂的问题。DeepNash 在 Stratego 中击败了现有的最先进的 AI 方法,并在世界上最大的Stratego平台 Gravon 的人类专家中取得了年初至今(2022 年)和历史前三的排名。