【标题】Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning
【作者团队】Jerin Paul Selvan, Pravin S. Game
【发表日期】2022.7.28
【论文链接】https://arxiv.org/pdf/2207.14140.pdf
【推荐理由】十多年来,机器人技术和人工智能体的使用已成为普遍现象。人工智能体可根据算法在其所处的环境中的行为进行操作。其能够以多快的速度区分奖励行为和敌对行为,目标是通过对能够避免所有障碍的行动做出决策来达到最远的目标。本文选择名为“Flappy Bird”的游戏,其目标是让鸟穿过一组随机高度的管道。鸟必须进入这些管道之间,不得撞击顶部、底部或管道本身。鸟可以采取的动作是拍动翅膀或在重力作用下坠落。在人工智能体上实施的算法是增强拓扑的神经进化(NEAT)和增强学习。NEAT算法采用人工智能体的“N”初始种群。它们遵循遗传算法,考虑目标函数、交叉、变异和增广拓扑。强化学习记住状态、在该状态下采取的行动以及使用单个智能体和深度Q学习网络采取的行动所获得的奖励。随着人工智能体初始种群的增加,NEAT算法的性能得到提高。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢