【标题】Human-level play in the game of Diplomacy by combining language models with strategic reasoning
【作者团队】Meta Fundamental AI Research Diplomacy Team (FAIR)

【发表日期】22 Nov 2022

【论文链接】https://www.science.org/doi/10.1126/science.ade9097

【推荐理由】尽管在训练人工智能(AI)系统模仿人类语言方面取得了很大进展,但在交互环境中使用语言与人类进行有意交流的建筑代理仍然是一个主要挑战。该论文介绍了西塞罗(Cicero),他是第一个在《外交》(Diplomacy)中实现人类水平表现的人工智能代理,这是一个涉及合作和竞争的战略游戏,强调七个玩家之间的自然语言谈判和战术协调。Cicero将语言模型与规划和强化学习算法相结合,通过从对话中推断玩家的信念和意图,并根据其计划生成对话。在一个匿名的在线外交联盟的40场比赛中,西塞罗的平均得分是人类选手的两倍多,在超过一场比赛的参与者中排名前10%。

内容中包含的图片若涉及版权问题,请及时与我们联系删除