Diversifying AI: Towards Creative Chess with AlphaZero
T Zahavy, V Veeriah, S Hou, K Waugh, M Lai, E Leurent, N Tomasev, L Schut, D Hassabis, S Singh
[Google DeepMind]
AI的多样化:AlphaZero创造性下棋探索
-
提出训练一个多样的AlphaZero(AZ)智能体联盟AZdb来更创造性地下棋并更好地解决棋谜。 -
AZdb通过内在奖励实现行为多样性,并通过匹配器实现响应多样性,以鼓励不同的下棋风格,模仿了人类国际象棋运动员的专业化。 -
AZdb解决了常规AZ的两倍数量的棘手国际象棋谜题,包括计算机通常难以处理的知名Penrose体系。 -
AZdb联盟整体优于任何单个玩家,展现了“多样性红利”,不同的玩家根据其专业技能解决不同的谜题。 -
在完整的国际象棋游戏中,AZdb中的玩家专攻不同的开局。使用次加性规划为每个开局选择最佳玩家,相比AZ提供了50个Elo的提升。 -
组合拥有不同技能和知识的多样AI系统,很像人类,可以增强创造力、问题解决能力和整体表现。 -
简单的行为和响应多样性技术使复杂的AZ算法变得更具创造性,并更好地解决某些挑战。 -
AZdb解决了更多谜题,尽管没有明确的谜题训练,这表明了推理能力的真正提高。 -
相较单一的玩家,协调的专业化玩家的表现更好,尽管没有额外的训练或参数。
动机:旨在探索人工智能是否可以从创造性的决策机制中受益,并通过生成更多的想法来解决挑战性任务。
方法:通过构建一个多样化的人工智能系统联盟来扩展AlphaZero,并使用行为多样性技术生成更广泛的想法,并通过子加性规划选择最有前途的想法。
优势:实验结果表明,多样化的人工智能系统团队在困难任务中解决更多的难题,并表现出比较 homogeneous 团队更出色的性能。这表明多样性在解决计算难题中是一种有价值的资产。
探索了人工智能系统通过多样性决策机制来提高解决计算难题的能力,通过构建多样化的AlphaZero系统联盟,并使用行为多样性技术和子加性规划选择最有前途的想法。
https://arxiv.org/abs/2308.09175
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢