【标题】Solving job scheduling problems in a resource preemption environment with multi-agent reinforcement learning

【作者团队】Xiaohan Wang, Lin Zhang, Tingyu Lin, Chun Zhao

【发表日期】2022.3.3

【论文链接】https://www.sciencedirect.com/science/article/pii/S0736584522000138

【推荐理由】在智能制造领域,制造资源通常是有限的,因此机器人之间存在抢占关系。在这种情况下,作业调度对精度和通用性提出了更高的要求。为此,本文提出了一种利用多智能体强化学习解决资源抢占环境下作业调度问题的调度算法。资源抢占环境被建模为一个分散的部分可观测马尔可夫决策过程,其中每个作业被视为一个智能体,根据其当前的部分可观测选择一个可用的机器人。在此模型的基础上,构造了一个多智能体调度体系结构,用于处理多任务同时调度引起的高维动作空间问题。此外,多智能体强化学习用于学习每个智能体的决策策略和智能体之间的合作。本文在解决资源抢占环境下的调度问题和利用多智能体强化学习解决job-shop调度问题方面具有创新性。