【标题】Near-optimal Deep Reinforcement Learning Policies from Data for Zone Temperature Control
【作者团队】Loris Di Natale, Bratislav Svetozarevic, Philipp Heer, Colin N. Jones
【发表日期】2022.3.10
【论文链接】https://arxiv.org/pdf/2203.05434.pdf
【推荐理由】使用更智能的解决方案替换性能较差的现有控制器将降低建筑行业的能源强度。最近,基于深度强化学习(DRL)的控制器被证明比传统的基线更有效。然而,由于最优解决方案通常是未知的,目前尚不清楚DRL代理是否总体上达到了接近最优的性能,或者是否还有很大的差距。本文研究了DRL代理的性能,并与理论上的最优解进行了比较。为此,通过利用物理一致性神经网络(PCNN)作为模拟环境,优化控制输入易于计算。此外,PCNN完全依赖待训练的数据,避免了困难的基于物理的建模阶段,同时保持了物理一致性。研究结果表明,DRL代理不仅明显优于传统的基于规则的控制器,而且还获得了接近最优的性能。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢