【论文标题】深度强化学习的动态置换流水车间调度智能决策

【作者团队】Shengluo Yang, Zhigang Xu, Junyi Wang

【发表时间】  2021-02-02

【论文链接】https://www.mdpi.com/1424-8220/21/3/1019

【推荐理由】由于其实际意义,动态调度问题近年来已受到越来越多的关注。为了实现动态调度的实时和智能决策,我们使用深度强化学习(DRL)研究了具有新工作到达的动态置换流水车间调度问题(PFSP)。提出了一种使用DRL求解动态PFSP的系统架构,并建立了将总拖延成本最小化的数学模型。此外,对基于DRL的智能调度系统进行了建模,并设计了状态功能,动作和奖励。此外,优势参与者评论(A2C)算法适用于训练调度代理。学习曲线表明调度代理学会了在训练过程中有效地生成更好的解决方案。进行了广泛的实验以将基于A2C的调度代理与每个动作,其他DRL算法和元启发式算法进行比较。结果显示了考虑解决方案质量,CPU时间和泛化的基于A2C的调度代理的良好性能。值得注意的是,训练有素的代理平均仅在2.16毫秒内生成调度动作,该动作几乎是瞬时的,可用于实时调度。

内容中包含的图片若涉及版权问题,请及时与我们联系删除