【标题】Deep Reinforcement Learning With Quantum-Inspired Experience Replay

【作者团队】Qing Wei , Hailan Ma , Chunlin Chen , Daoyi Dong

【发表日期】2022.8.18

【论文链接】https://ieeexplore.ieee.org/document/9357477

【推荐理由】本文提出了一种受量子计算启发的新型训练范式,用于具有经验回放的深度强化学习 (DRL)。与 DRL 中传统的经验回放机制相比,具有量子启发的经验回放(DRL-QER) 的 DRL 根据每个经验的复杂性和回放时间(也称为转换)自适应地从重放缓冲区中选择经验,以在探索和利用之间取得平衡。在 DRL-QER 中,转换首先以量子表示形式表示,然后对转换执行准备操作和折扣操作。在这个过程中,准备操作反映了时间差误差(TD-errors)与经验重要性之间的关系,同时考虑了折扣操作,保证了过渡的多样性。在 Atari 2600 游戏上的实验结果表明,DRL-QER 在大多数此类游戏上都优于最先进的算法,并提高了训练效率,并且也适用于基于内存的 DRL 方法。