DeepMind一直尝试用AI来玩一些复杂多变的策略性游戏,以训练出接近人类智力水平的智能体。在足球运动中,团队协作是智能体训练面临的最大挑战,它不仅要对足球规则、技巧十分娴熟,还要对赛场上的局势,队友和对手的位置、以及目标有更好的理解,以做出更理性的决策。

DeepMind表示,此次升级的AI智能体训练出了对他人的“意识”,能够在更大的时空维度上,与队友协同配合完成更复杂的作战策略。

最近DeepMind发表了一篇名为“From Motor Control to Team Play in Simulated Humanoid Football”的技术论文,同时发布了演示视频。

论文地址:https://arxiv.org/pdf/2105.12196.pdf

在这篇论文中,研究人员通过仿真人形模拟足球运动,提出了将模仿学习、单智能体和多智能体强化学习与群体训练相结合的方法,并在不同抽象层次上利用行为的可转移表征主导决策。

在训练阶段,这个具有全关节的人形智能体球员先是通过模仿学习学会了一些基础动作。紧着掌握了运球、射门等中等水平的足球技能。最后通过毫秒级的运动控制实现了多智能体团队协作,弥合了数十秒范围内行为与目标之间的差距。

内容中包含的图片若涉及版权问题,请及时与我们联系删除