【标题】Resource Allocation in Time Slotted Channel Hopping (TSCH) networks based on phasic policy gradient reinforcement learning
【作者团队】Lokesh Bommisetty, T.G. Venkatesh
【发表日期】2022.4.8
【论文链接】https://www.sciencedirect.com/science/article/pii/S2542660522000257#!
【推荐理由】工业物联网 (IIoT) 的概念因其低成本解决方案和提高制造过程的生产力而日益受到重视。为了满足 IIoT 网络的超高可靠性和超低功耗通信要求,IEEE 802.15.4e 标准中引入了时隙信道跳频 (TSCH) 行为模式。由于资源有限和动态拓扑,在 IIoT 网络中调度数据包传输是一项艰巨的任务。。本文提出了一种基于阶段性策略梯度(PPG)的 TSCH 调度学习算法。本文构建了考虑 TSCH 网络的吞吐量和能源效率的效用函数。本文所提出的基于 PPG 的调度算法克服了完全分布式和完全集中的基于深度强化学习的调度算法的缺点,采用了actor-critic 策略梯度方法,该方法分两个阶段学习调度算法,即策略阶段和辅助阶段。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢