4 月 25 日,腾讯 AI Lab 宣布棋牌类 AI「绝艺」取得新突破,在 1v1 麻将(二人雀神)测试中战胜职业冠军选手。团队在大规模强化学习算法框架下提出了一个新的策略优化算法 Actor-Critic Hedge (ACH),部分解决了大规模深度强化学习自博弈收敛不到纳什均衡最优解的问题。该算法及对应二人麻将 benchmark 已通过论文开源,并被机器学习顶会 ICLR 2022 收录。
论文链接:
https://openreview.net/pdf?id=DTXZqTNV5nW
ACH 具体算法流程如下:
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢