- 简介在多人游戏中,像《反恐精英:全球攻势》(CS:GO)这样的第一人称射击游戏中,协调的移动是高水平战略游戏的关键组成部分。然而,团队协调的复杂性和流行游戏地图中存在的各种条件使得为每种情况编写手工制作的移动策略变得不切实际。我们展示了一种可能的方法,即采用数据驱动的方法为CS:GO创建类似人类的移动控制器。我们策划了一个团队移动数据集,包括123小时的专业游戏玩法轨迹,并使用该数据集来训练一个基于Transformer的移动模型,为游戏中“重拾”回合中的所有玩家生成类似人类的团队移动。重要的是,移动预测模型是高效的。在单个CPU核心上,为所有玩家执行推理每个游戏步骤的成本不到0.5毫秒(平均成本),使其在商业游戏中的使用变得可行。人类评估者评估我们的模型行为更像人类,比商业可用的机器人和由专家编写的程序移动控制器的“人类化”TrueSkill评分高16%到59%。通过涉及游戏中机器人对机器人自我对战的实验,我们证明了我们的模型执行简单的团队合作形式,犯的常见移动错误更少,并产生类似于观察到的专业CS:GO比赛玩法的移动分布,玩家寿命和击杀位置。
- 图表
- 解决问题本论文试图解决在多人射击游戏中的团队协作问题,通过数据驱动的方法生成类人的团队移动控制器,提高游戏体验。
- 关键思路论文的关键思路是使用一个基于transformer的移动预测模型,通过训练123小时的专业游戏玩家的移动数据集,生成类人的团队移动,模型效率高,可在商业游戏中使用。
- 其它亮点论文使用了123小时的专业游戏玩家的移动数据集进行训练,并通过人类评估证明该模型比商业可用的机器人和专家编写的程序化移动控制器更类人;论文进行了多种实验,包括自我对战实验和与专业比赛的比较,证明该模型表现出简单的团队合作,减少了常见的移动错误,并产生了类似于专业比赛的移动分布、玩家生存时间和击杀位置。
- 与该论文相关的研究包括使用强化学习的游戏智能体控制、使用深度学习的游戏AI生成、基于机器学习的游戏玩家行为建模等。
沙发等你来抢
去评论
评论
沙发等你来抢