智源大会是人工智能领域最具影响力的学术盛会,7年来,14位图灵奖得主与全球AI先锋齐聚,成为AI内行人的年度思想坐标。


2026年6月12日-13日,第8届智源大会如期而至。大会坚持“学术硬核”,汇聚200余位顶尖专家学者与40余位AI企业CEO及联合创始人,共同探讨Agent、世界模型、具身智能、AI自进化与AI安全等前沿议题,期待与全球AI同行相聚北京,共同定义下一代智能未来。

    

AI智能体安全 论坛丨6月13日 上午


随着大模型从生成走向自主规划、工具调用与跨环境执行,智能体系统正快速扩大攻击面,并带来记忆投毒、工具链劫持、多步失控等新型风险。如何在高自主性条件下维持有效人类控制、构建可信智能体系统,并利用 Agent 重构网络安全体系,正成为全球 AI 安全的重要前沿议题。AI智能体安全论坛由智源研究院和安远AI联合主办,聚焦“研究与工程的交汇点”,围绕自主智能体风险治理、安全评测、红队攻防、安全护栏与 AI 原生安全基础设施等方向展开讨论,推动智能体安全从问题意识走向可验证、可落地的系统能力。


扫码报名参会

2026北京智源大会倒计时:


开幕致辞



谢旻希,安远AI创始人兼CEO 

谢旻希是安远 AI 的创始人兼 CEO,安远 AI 是一家人工智能安全与治理领域的第三方研究和咨询机构,同时是目前该领域中国唯一的社会企业。谢旻希现任世界人工智能大会人工智能治理顾问、中国科协“科普中国智库”专家委员会专家(人工智能领域)、中国人工智能产业发展联盟(AIIA)安全治理委员会专家。他参与了全国网安标委 TC260、全国信标委 TC28 等相关人工智能标准工作组,并曾获国家标准化管理委员会推荐,代表中国参与 ISO/IEC/ITU 国际 AI 标准峰会。此前,他曾是联合国“高级别人工智能咨询机构”的专业咨询网络成员,曾任人工智能行业联盟 Partnership on AI 的高级顾问。他的工作和观点曾多次见诸《自然》《时代》《人民日报》及新华社等权威媒体。



演讲主题及嘉宾介绍
(按照发言先后顺序)

主题一:自主智能体的前沿风险


1. A Survey on Trustworthy LLM Agents: Threats and Countermeasures



安波,南洋理工大学校长讲席教授,人工智能交叉研究院院长

安波是新加坡南洋理工大学校长讲席教授,人工智能系主任,南洋理工大学人工智能交叉研究院院长,于2011年在美国麻省大学 Amherst 分校获计算机科学博士学位。主要研究领域包括人工智能、多智能体系统、算法博弈论、强化学习、及优化。有200余篇论文发表在人工智能领域的国际顶级会议 AAMAS, IJCAl, AAAI, ICLR, NeurIPS, ICML, AISTATS, ICAPS, KDD, UAI, EC, WWW 以及著名学术期刊 JAAMAS和AIJ。曾获2010  IFAAMAS 杰出博士论文奖、2011年美国海岸警卫队的卓越运营奖、2012 AAMAS 最佳应用论文奖、2016年 IAAI 创新应用论文奖,2020 DAI 最佳论文奖,2012年美国运筹学和管理学研究协会(INFORMS) Daniel H.Wagner 杰出运筹学应用奖,2018年南洋青年研究奖、以及2022年南洋研究奖等荣誉。受邀在2017年lJCAl上做 Early CareerSpotlight talk。他曾获得2017年微软合作AI挑战赛的冠军。并曾入选2018年度 IEEE Intelligent Systems 的 Al's 10 to Watch。 他是 IEEE IntelligentSystems  的主编,AIJ、JAAMAS、ACM TIST 和 ACM TAAS 的副主编。担任过 AAMAS'20 的程序委员会主席和 AAMAS'23 会议主席。他当选 AAAIFellow。他是 IJCAI 以及 AAAI 理事会成员并将担任 IJCAI'27 的程序委员会主席。当选为国际智能体及多智能体系统协会理事会成员及 ACM 杰出科学家。



2. 智能体系统全栈安全技术研究



杨珉,复旦大学计算与智能创新学院执行院长、教授

杨珉,复旦大学计算与智能创新学院执行院长、教授、博士生导师,入选国家级领军人才计划,第八届国务院学位委员会网络空间安全学科评议组成员,重点研发计划首席科学家,973项目首席科学家,国家网络安全优秀教师,上海市网络安全工作特殊贡献个人。



3. Governance and regulation challenges of ensuring meaningful human control over autonomous systems



Toby Walsh,新南威尔士大学(UNSW)Scientia AI教授、UNSW AI研究所首席科学家

Toby Walsh 是悉尼新南威尔士大学和联邦科学与工业研究组织(CSIRO)Data61 的人工智能杰出教授。他是享有盛誉的塞莱斯蒂诺·尤里卡促进科学理解奖(Celestino Eureka Prize for Promoting Understanding of Science)的获得者,并入选了国际“人工智能名人录”影响力人物名单。他经常出现在电视和广播节目中,曾接受过《纽约时报》的人物专访,并为大众读者撰写了五本关于人工智能的书籍,最近的作品名为《人工智能简史》(The Shortest History of AI,2025)和《虚假:人类世界中的人工智能》(Faking It: Artificial Intelligence in a Human World)。他是澳大利亚科学院院士,并被《澳大利亚人报》评为澳大利亚数字革命的“摇滚明星”之一。他曾获得洪堡奖(Humboldt Prize)和新南威尔士州总理工程与信息通信技术卓越奖。他的推特账号被票选为紧跟人工智能发展动态最值得关注的前十名之一。



4. Checking in on the Agentic AI Ecosystem: Safety, Geopolitics, and Consolidation of Power



Stephen Casper,MIT AI安全研究员

Stephen Casper 是一位计算机科学家,也是哈佛大学肯尼迪学院即将上任的公共政策助理教授。他在麻省理工学院获得了博士学位,此前曾任职于英国人工智能安全研究所(UK AI Security Institute)。他的工作专注于人工智能防护措施和技术治理。他的研究曾出现在 NeurIPS、AAAI、Nature、FAccT、EMNLP、SaTML、TMLR、IASEAI、若干课程大纲、多个研讨会以及数十篇新闻文章和时事通讯中。他也是 International AI Safety Report 和 Singapore Consensus 的撰稿人。他的研究获得了胡普斯奖、ML Safety Workshop 最佳论文奖、BioSafeGenAI 最佳论文亚军、GenLaw 亮点论文奖、TMLR 杰出论文入围奖,并在新闻文章和时事通讯中被提及数十次。



圆桌讨论:自主智能体的前沿风险(英文)




圆桌嘉宾:

安   波丨南洋理工大学校长讲席教授,人工智能交叉研究院院长

杨   丨复旦大学计算与智能创新学院执行院长、教授

Toby Walsh丨新南威尔士大学(UNSW)Scientia AI教授、UNSW AI研究所首席科学家

主持人丨杨耀东丨北京大学人工智能研究院助理教授、研究员(博雅学者),智源研究院大模型安全研究中心负责人




圆桌主持人



杨耀东,北京大学人工智能研究院助理教授、研究员(博雅学者),智源研究院大模型安全研究中心负责人

杨耀东,北京大学人工智能研究院助理教授、研究员(博雅学者),智源研究院大模型安全研究中心负责人,北大-灵初智能联合实验室首席科学家。国家人社部高层次留学人才、国家级优秀青年人才、中国科协青年托举计划入选者。主要研究方向为智能体交互学习与对齐,科研领域涵盖强化学习、AI 对齐与具身智能。在 Nature Machine Intelligence、Cell Matter、AIJ、TPAMI 等国际顶级期刊和会议发表论文二百余篇,谷歌学术引用逾 16,000+ 次。自 2022 年以来位列 CSRanking 北大 AI/ML 方向学者首位,入选 Scopus 全球 Top 2% 顶尖科学家。五次获得最佳论文奖: ACL 2025 最佳论文奖、英国科研与创新局 UKRI 2026 年度最佳论文、ICCV 2023 最佳论文奖入围、CoRL 2020 最佳系统论文奖、AAMAS 2021 最佳前瞻性论文奖。入选麻省理工科技评论「AI 100 青年榜」、福布斯中国 2025 科创革新力人物、WAIC 2022「云帆奖·璀璨明星」及 ACM SIGAI China 新星奖。



主题二:构建可信智能体系统


1. 从内容安全到前沿人工智能风险图谱



易婧玮,北京智源人工智能研究院(BAAI)大语言模型安全中心研究员

易婧玮,北京智源人工智能研究院(BAAI)大语言模型安全中心研究员。于中国科学技术大学获得计算机科学博士学位,师从微软亚洲研究院谢幸博士与中国科学技术大学孙广中教授。主要从事负责任人工智能研究,聚焦大语言模型的社会影响、安全性与可靠性问题。在 LLM 越狱攻击与防御、安全对齐、AI 欺骗行为等方向取得多项创新成果,提出了 Self-Reminder 等代表性防御方法。相关研究发表于 Nature Machine Intelligence、ACL、KDD、EMNLP 等顶级期刊与会议。


2. Reasoning Beyond LLM and a Vision for Life After Superintelligence: The Player and Gatekeeper Era



Jin Song Dong,新加坡国立大学计算机科学教授

Jin Song Dong(董劲松),新加坡国立大学计算机科学教授。他的研究领域涵盖多个方向,包括结合大语言模型智能体的形式化方法、安全与安防系统、可信人工智能、概率推理、体育分析以及经过验证的大语言模型代码合成。他共同创立了商业化的 PAT 验证系统,该系统已拥有来自150多个国家的数千名注册用户。董劲松还共同创立了商业化的可信机器学习系统 Silas,下载量超过5万次。他在顶级期刊和会议(如 ICML、NeurIPS、ICLR、CVPR、ACL、AAAI、POPL、ICSE、FM、CAV)上发表了200多篇论文,并多次获得最佳论文奖。他曾担任《ACM Transactions on Software Engineering and Methodology》和《Formal Aspects of Computing》的编委。他成功指导了34名博士生,其中许多人已成为世界顶尖大学的终身教授。他是澳大利亚工程师学会会士。董劲松利用 PAT 为网球战术分析开发了马尔可夫决策过程模型,协助职业选手进行赛前分析(曾击败世界顶尖选手)。业余时间,他是一名网球教练,乐于指导自己的学生和三个孩子——这三个孩子均曾位列新加坡/澳大利亚全国青少年排名第一,其中两个孩子已获得美国 NCAA Division-1 全额奖学金。



3. Shifting the Focus of AI Safety: From Models to Systems



李朝卓,北京邮电大学副研究员

李朝卓,北京邮电大学网络空间安全学院副研究员,曾任微软亚洲研究院主管研究员。主要研究方向为可信大语言模型与自进化智能体,已在国际顶级期刊及 CCF A 类会议上发表论文百余篇,荣获 WSDM、PAKDD 等国际知名会议最佳论文奖,并率队夺得 KDD Cup 等国际顶级竞赛奖项。相关研究成果已成功应用于必应搜索、Xbox 等微软知名产品。



4. 面向可信多模态大模型:攻击、评测与对齐



严宇萍,西湖大学博士后研究员

严宇萍,西湖大学博士后研究员,主要从事大模型/智能体和具身智能安全。她于2024年在匈牙利厄特沃什·罗兰大学获得博士学位,目前的研究兴趣主要为(1)智能体安全;(2)多模态大语言模型的安全评测;(3)具身智能安全。曾获 IEEE Best paper award,现任 complex&intelligence system 期刊的 managing editor。



圆桌讨论:构建可信智能体系统(中文)




圆桌嘉宾:
易婧玮丨北京智源人工智能研究院(BAAI)大语言模型安全中心研究员
Jin Song Dong丨新加坡国立大学计算机科学教授
严宇萍丨西湖大学博士后研究员

张   岸丨中国科学技术大学特任教授

主持人丨王金戈丨安远AI 大模型安全研发工程师




嘉宾介绍




张岸,中国科学技术大学特任教授

张岸,中国科学技术大学特任教授、博士生导师,国家级青年人才,荣获2025年 Web 领域女性新星奖。主要研究领域为大模型驱动的智能体、个性化大模型、可信人工智能,特别关注于智慧校园、大模型安全、以及个性化场景,致力于下一代通用人工智能模型的关键能力与性质研究。相关工作在 NeurIPS、ICLR、ICML、WWW、KDD、SIGIR、TOIS、TPAMI 等顶级国际会议和期刊发表录用长文40余篇,其中超过3篇论文入选了最高引和最具影响力榜单,Google 学术引用超四千次,H-index 达30。


圆桌主持人


  



王金戈,安远AI 大模型安全研发工程师

王金戈是安远 AI 的大模型安全研究工程师,负责安远 AI 在大模型安全测评领域的相关研发工作,同时担任 AI 安全开放社区(OCASC)联合创始人。在技术创新与科研方面,他持有10项国内外发明专利,并曾获2021年中国发明协会发明创业奖创新奖二等奖。王金戈曾于微软、旷视科技从事搜索引擎及计算机视觉的算法研发,并曾在西湖大学开展“AI 科学家”相关课题研究,长期关注 AI 安全科普教育、AI 系统性风险、可解释性及 AI 意识等前沿治理领域。



主题三:用智能体重构网络安全体系


1. AI智能体及前沿安全实践




田天,瑞莱智慧Real AI创始人兼CEO

田天,瑞莱智慧公司创始人、首席执行官,博士毕业于清华大学计算机系,曾荣获清华大学特等奖学金、西贝尔学者称号。 获“吴文俊人工智能优秀青年奖”、第五届杰出工程师青年奖等荣誉。



2. 攻防失衡下的范式转变——迈向AI原生智能体安全体系



刘岩,奇安信人工智能公司副总裁

刘岩,奇安信人工智能公司副总裁、奇安信科技集团股份有限公司 核心技术人员。智能安全产品线负责人,负责奇安信智能安全(AI Security)领域全面产品业务。同时兼任奇安信广西人工智能安全研究院总工程师。



圆桌讨论:用智能体重构网络安全体系(中文)




圆桌嘉宾:

李朝卓|北京邮电大学副研究员

田   天|瑞莱智慧Real AI创始人兼CEO

刘   岩丨奇安信人工智能公司副总裁

杜跃进|浙江大学求是特聘教授

主持人丨方亮|安远AI安全治理主管




圆桌主持人



方亮,安远AI安全治理主管

方亮是安远AI安全治理主管,领导安远 AI 在国内的 AI 政策与标准制定咨询工作,同时担任中国人工智能产业发展联盟(AIIA)安全治理委员会专家。在标准建设方面,他曾深度参与过多项AI安全与治理的国标和行标制定。方亮曾任百度高级技术顾问,致力于在企业内部推动 AI 伦理与治理的研究、交流与落地实践;此前,他曾在中国联通、亚信数据长期从事战略研究与规划工作,并多次参与国家各部委在 AI 及前沿科技领域的政策制定。



闭幕致辞



杜跃进,浙江大学求是特聘教授

杜跃进,博士,浙江大学求是特聘教授,区块链与数据安全全国重点实验室首席研究员,贵州大数据安全工程研究中心主任。曾任网络安全应急技术国家工程研究中心创始主任、亚太应急响应合作组织副主席、阿里巴巴集团技术副总裁兼首席安全专家、360集团副总裁兼首席安全官等职。长年从事网络安全、数据安全、人工智能安全研究工作,获得国家科技进步一等奖、新世纪百千万人才工程国家级人才、国务院特殊津贴等多项国家级荣誉和奖励。



即刻扫码注册,参与大会报名

报名通道已开启,欢迎扫码免费注册。线下席位有限,组委会将根据注册次序审核,并发送审核结果通知
图片
大会官网 https://2026.baai.ac.cn
智能体听会 
- 往期推荐 -

2026智源大会议程公开|AI自进化论坛

2026智源大会议程公开|世界模型论坛
本文版权归智源社区所有

内容中包含的图片若涉及版权问题,请及时与我们联系删除