【标题】A survey for deep reinforcement learning in markovian cyber-physical systems: Common problems and solutions

【作者团队】Timothy Rupprecht, Yanzhi Wang

【发表日期】2022.5.21

【论文链接】https://www.sciencedirect.com/science/article/pii/S0893608022001873#!

【推荐理由】深度强化学习 (DRL) 越来越多地应用于自动化任务的信息物理系统。重要的是记录 DRL 应用的发展趋势,以帮助研究人员使用通用解决方案克服常见问题。本文调查了两种应用环境中的趋势:运动控制任务和资源分配任务。常见问题包括动作空间或状态空间的难处理性,以及与现实世界中训练系统的高昂成本相关的障碍。真实世界的训练数据稀疏且难得,在真实世界中训练可能会损坏其学习系统。研究人员提供了一套通用的解决方案解决棘手的问题,已经成功地通过人为设置奖励函数、辅助学习以及在向更复杂的系统执行迁移学习之前简化状态或动作空间来指导网络训练。许多算法使用多智能体或分层学习来减少状态或动作空间的难处理性。训练成本过高的常见解决方案包括使用基准和模拟。这需要模拟和现实世界共有的共享特征空间。

内容中包含的图片若涉及版权问题,请及时与我们联系删除