【标题】Deep Reinforcement Learning for a Two-Echelon Supply Chain with Seasonal Demand
【作者团队】Francesco Stranieri, Fabio Stella
【发表日期】2022.4.20
【论文链接】https://arxiv.org/pdf/2204.09603.pdf
【推荐理由】本文利用强化学习和深度学习的最新发展来解决供应链库存管理问题,这是一个复杂的顺序决策问题,包括确定在给定时间范围内生产和运送到不同仓库的最佳产品数量。给出了随机两级供应链环境的数学表达式,允许管理任意数量的仓库和产品类型。此外,开发了一个与深度强化学习算法接口的开源库,并将其公开用于解决库存管理问题。通过对综合生成的数据进行丰富的数值实验,比较了最先进的深度强化学习算法所取得的性能。设计并实施了实验计划,包括供应链的不同结构、拓扑、需求、能力和成本。结果表明,PPO算法能够很好地适应环境的不同特点。VPG算法几乎总是收敛到局部最大值,即使它通常达到可接受的性能水平。数值实验表明,深度强化学习的表现始终优于标准的库存管理策略,如静态(s,Q)-策略。因此,它可以被认为是解决随机两级供应链问题的一个实用而有效的选择。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢