【标题】Pursuit and Evasion Strategy of a Differential Game Based on Deep Reinforcement Learning

【作者团队】Can Xu, Yin Zhang, Weigang Wang, Ligang Dong

【发表日期】2022.3.22

【论文链接】https://www.frontiersin.org/articles/10.3389/fbioe.2022.827408/full

【推荐理由】作为深度神经网络(DNN)和强化学习的结合,深度强化学习 (DRL) 成为解决微分博弈问题的新范式。本文建立了一个强化学习环境,并将相关的 DRL 方法应用于特定的仿生微分博弈问题:狗羊博弈。狗羊游戏环境设置在狗追逐试图逃跑的羊的圆圈上。根据一些假设,本文可以得到运动学的追逃策略。本研究将基于价值的深度Q网络(DQN)模型和深度确定性策略梯度(DDPG)模型应用于狗羊游戏,试图赋予羊成功逃脱的能力。同时本研究提出了具有超时策略的奖励机制和具有绵羊转向角衰减机制的游戏环境。这些修改有效地增加了羊逃跑的概率。结果表明,DQN 模型的修改有效地将逃逸概率提高到与 DDPG 模型相同的水平。

内容中包含的图片若涉及版权问题,请及时与我们联系删除