【标题】Alleviating Parameter-tuning Burden in Reinforcement Learning for Large-scale Process Control(减轻大规模过程控制强化学习中的参数调整负担)
【作者团队】Lingwei Zhu, Go Takami, Mizuo Kawahara。 Nara Institute of Science and Technology
【发表日期】6 January, 2022
【论文链接】https://www.sciencedirect.com/science/article/pii/S0098135422000035#!
【推荐理由】现代过程控制器需要高质量模型和在性能下降时重新识别补救系统。强化学习 (RL) 可以成为手动程序的有希望的替代品。然而,现实中,时间是有限的,需要能够通过减少人机交互或自我探索(例如参数调整)进行稳健学习的算法。本文提出了一个有原则的框架,以确保即使参数表现不佳也能改进单调策略,增强 RL 过程对参数设置的鲁棒性。本文将随机特征和因子策略等关键因素纳入单调改进机制,以便在大规模过程控制问题中谨慎学习。本文在模拟醋酸乙烯单体过程的具有挑战性的控制问题中证明,所提出的方法在给定模拟相互作用的各种参数配置的情况下,在短期固定学习范围内稳健地学习有意义的策略,与其他方法相比,该方法只能在较窄的参数范围内表现出良好的性能。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢