对棋类游戏的掌握程度,一直是判断人工智能(AI)是否真正智能的依据之一,因为这类游戏可以被用来评估 AI 代理在受控环境下自主开发和执行策略的能力。如今,AI 在此前尚未掌握的经典棋类游戏 Stratego(西洋陆军棋)中,表现出了人类专家级一般的水准:以 97% 的最低胜率击败了其他 AI 机器人;在 Gravon 平台上与人类专业玩家对弈,取得了 84% 的总胜率,在年初至今和历史排行榜上都排在前三名。

近日,DeepMind的AI智能体DeepNash,在西洋陆军棋(Stratego)中花式战胜专业级人类玩家,成功跻身Top 3。12月1日,论文正式在Science上发表。

值得注意的是,这一惊人表现是在没有部署任何搜索方法的情况下实现的,这是 AI 之前在棋类游戏中取得多个里程碑式成就的关键。

相关研究论文以“Mastering the game of Stratego with model-free multiagent reinforcement learning”为题,已发表在权威科学期刊 Science 上。

Science原文地址  www.science.org/doi/10.1126/science.add4679

多年来,Stratego 一直是人工智能行业的下一个前沿领域之一。Stratego 玩家既需要有像玩国际象棋一样的长期战略性思考,也需要能够像打扑克一样处理不完全的信息,这意味着参与人在进行博弈时不清楚博弈中的某些要素。例如,在桥牌游戏中,玩家并不清楚其他玩家手中的牌,在拍卖会中,竞拍人并不清楚其他竞拍人对物品的估价。

 这个名为“DeepNash”的 AI 代理出自 DeepMind,在他们看来,这代表了一个非凡的成果;同样,Stratego 社区也认为,这用现有技术是不可能实现的。该方法在这类不完全信息场景下或许有很多潜在应用,包括人群和交通建模、智能电网、拍卖设计和市场问题等。

本文转载于公众号学术头条

阅读原文请点击这里