IJCAI2022《对抗序列决策》教程

苦行僧 2022-07-27 22:43 分享

以下文章来源于mp.weixin.qq.com

本教程将概述在序列决策设置中的对抗性学习的最新研究。特别地，本教程将侧重于基于多臂赌博机、强化学习和多智能体交互的对抗性攻击和防御机制。本教程将暂时涵盖以下列出的内容。

教程地址：https://adversarial-rl.org/ijcai2022/index.html

介绍

序列决策入门: 多臂赌博机，强化学习，多智能体交互，和博弈。
对抗性序列决策如何不同于对抗性监督学习的高级概述。
攻击策略和防御机制的高级概述。

多臂赌博机

不同反馈破坏模型和目标下的最优攻击策略。
最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

强化学习

讨论不同的学习范式(例如，模仿学习、离线学习和在线学习)，以及它们在对抗性攻击中是如何区别的。
测试时间、训练时间和后门攻击的最优攻击策略。
不同数据破坏模型和攻击目标下的最优攻击策略。
最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

多智能体相互作用和博弈论考虑

多智能体系统中通过控制其他智能体的攻击和非健忘攻击。
利用博弈论工具防御攻击。

实际考虑和讨论

针对学习代理的安全威胁案例研究。
在对抗性序列决策中开发基准工具和数据集。
与观众公开讨论，促进跨社区合作。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

沙发等你来抢

去评论