【标题】Meta-Learning-based Deep Reinforcement Learning for Multiobjective Optimization Problems

【作者】Zizhen Zhang, Zhiyuan Wu, Jiahai Wang

【论文链接】https://arxiv.org/pdf/2105.02741.pdf

【发表日期】2021.5.6

【推荐理由】深度强化学习 (DRL) 最近在解决复杂的组合优化问题方面取得了显著的成效。当这些问题扩展到多目标问题时,现有的 DRL 方法存在训练速度慢、很难灵活有效地适用及处理由目标权重分解确定的多个子问题。基于此,本文提出了一种简洁的基于元学习的 深度强化学习方法。它首先通过元学习训练元模型,并将子模型的直接训练过程修改为元模型的微调过程,从而大大减少了求解子问题所需的梯度更新步骤,增强了基于学习的方法的灵活性和通用性。具体来说,将注意力模型纳入了MOTSP的MLDRL框架中。再构建帕累托模型以解决多目标组合优化问题。通过多目标旅行商问题的计算实验表明该方法优于大多数基于学习和基于迭代的方法,而且在处理不同尺度的问题时具有良好的泛化能力。

内容中包含的图片若涉及版权问题,请及时与我们联系删除