【标题】Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless Networks

【作者团队】Riccardo Marini, Sangwoo Park, Osvaldo Simeone, Chiara Buratti

【发表日期】2022.7.13

【论文链接】https://arxiv.org/pdf/2207.06131.pdf

【推荐理由】无人机基站(UABS)可以部署在车载无线网络中,以支持通过车载到一切(V2X)服务扩展传感等应用。此类系统中的一个关键问题是设计能够有效优化 UABS 轨迹以最大化覆盖范围的算法。在现有解决方案中,这种优化通常通过传统的强化学习(RL)从零开始对任何新的流量配置进行。本文提出使用连续元RL作为一种手段,将信息从以前经历的流量配置传输到新的条件,目的是减少优化UABS策略所需的时间。采用连续元策略搜索(CoMPS)策略,与传统RL以及朴素的迁移学习方法相比,并证明了显著的效率提高。

内容中包含的图片若涉及版权问题,请及时与我们联系删除