【标题】A Temporal-Pattern Backdoor Attack to Deep Reinforcement Learning
【作者团队】Yinbo Yu, Jiajia Liu, Shouqing Li, Kepu Huang, Xudong Feng
【发表日期】2022.5.5
【论文链接】https://arxiv.org/pdf/2205.02589.pdf
【推荐理由】深度强化学习 (DRL) 在许多实际应用中取得了显着成就。但由于遮挡和嘈杂的传感器,这些现实世界的应用程序通常只能为做出决策提供部分观察结果。但是,部分状态可观察性可用于隐藏后门的恶意行为。本文探索了 DRL 的序列性质,并提出了一种新的 DRL 时间模式后门攻击,其触发是一组对一系列观察而不是单个观察的时间约束,并且效果可以保持在一个可控的范围内。持续时间而不是瞬间。使用云计算中的一个典型作业调度任务验证了所提出的后门攻击。大量实验结果表明,该方法可以实现出色的有效性、隐蔽性和可持续性。并且平均干净数据准确率和攻击成功率分别可达97.8%和97.5%。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢