【作者团队】Alexander Neuwirth, Derek Riley
【作者单位】Department of Electrical Engineering and Computer Science,Milwaukee School of Engineering
【论文链接】https://arxiv.org/ftp/arxiv/papers/2112/2112.01451.pdf
【推荐理由】为了满足对深度强化学习 (DRL) 日益增长的兴趣,本文试图构建一个 DRL 驱动的 Atari Pong 智能体和伴随的可视化工具。现有方法不支持创建具有易于配置的物理和人工控制播放器的交互式展览所需的灵活性。因此,本文构建了一个新的 Pong 游戏环境,发现并解决了将 DRL 应用于新环境时出现的许多独特的数据缺陷,构建和调整了基于策略梯度的 DRL 模型,开发了实时网络可视化,并将这些结合起来元素进入交互式显示,以帮助建立对 DRL 推理机制的直觉和意识。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢