【标题】An Adaptive Network Slice Combination Algorithm Based on Multi-step Temporal-difference Learning
【作者团队】Guomin Wu, Guoping Tan
【发表日期】2022.3.8
【论文链接】https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9729778
【推荐理由】本文提出了现有的多臂强盗(MAB)算法用于网络优化,不考虑学习步骤的调整。同时本文针对智能切片组合问题相应地提出了一种用于自适应组合的多步时间差学习(SC-MTD)算法,该算法包括双层优化。在外层中,更新Q值以随着时间的推移达到较低的网络成本,这在高可靠性和低延迟之间体现了更好地权衡。在内层中,连续修改选择度,这表明其用于所提出的算法的学习步骤的可变性。最后,数值结果验证了SC-MTD算法的收敛。此外,与现有的MAB算法相比,可以获得较低的网络成本。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢