【标题】Average reward adjusted deep reinforcement learning for order release planning in manufacturing
【作者团队】Manuel Schneckenreither, Stefan Haeussler, Juanjo Peiró
【发表日期】2022.4.12
【论文链接】https://www.sciencedirect.com/science/article/pii/S0950705122003598
【推荐理由】生产计划中的关键挑战之一,尤其是在离散制造中,是确定何时将哪些订单下达到车间。此计划任务的主要目的是平衡在制品(WIP)和利用率水平,以及及时完成订单。生产计划的两个最重要的属性是(i)在制品、流程时间和产量之间的高度非线性关系,以及(ii)动态变化的环境。尽管如此,大多数最先进的模型使用静态交货时间来解决这个问题。直到最近,一些研究才根据流动时间预测动态设置提前期,以对报告预期结果的动态操作特征做出反应。本文通过介绍使用强化学习 (RL) 随时间动态设置交货时间的订单发布模型,为这一研究领域做出了贡献。应用的 RL 智能体专为具有周期性反馈和高度可变上下文的过程而设计。本文通过使用多阶段、多产品流水车间模拟模型进行算法比较试验,获得良好的结果。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢