【标题】Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention mechanism

【作者团队】Yunhui Zeng, Zijun Liao, Yuanzhi Dai, Rong Wang, Xiu Li, Bo Yuan

【发表日期】2022.1.3

【论文链接】https://arxiv.org/pdf/2201.00548.pdf

【推荐理由】动态Job Shop调度问题(DJSP)是一类调度任务,它在实际的智能制造环境中,具体考虑固有的不确定性,如变化的订单要求和可能的机器故障。由于传统方法无法在环境干扰下动态生成有效的调度策略,故本文将DJSP描述为一个马尔可夫决策过程(MDP),通过强化学习(RL)进行处理。进而提出了一个灵活的混合框架,该框架以析取图为状态,将一组通用调度规则作为具有最少先验领域知识的动作空间。注意机制被用作状态特征提取的图形表示学习(GRL)模块,并采用具有优先重放和噪声网络的双决斗深度Q网络(D3QPN)将每个状态映射到最合适的调度规则。此外,本文还介绍了Gymjsp,一个基于著名OR库的公共基准,为RL和DJSP研究社区提供标准化的现成工具。在各种DJSP实例上的综合实验证实,本文提出的框架优于基线算法,在所有实例中具有更小的制造跨度,并为混合框架中各种组件的有效性提供经验证明。

内容中包含的图片若涉及版权问题,请及时与我们联系删除