2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制航图。报名通道已开启


2025北京智源大会倒计时:10 

AI安全论坛丨6月7日 上午

中关村自主创新示范区展示中心


随着人工智能技术在各个领域的深度渗透,安全议题正成为全球关注的焦点。为应对智能时代的潜在风险,探讨AI安全与伦理治理的方式策略,2025智源大会延续了“AI安全”主题论坛。本论坛汇聚了来自清华大学、魁北克人工智能研究所、MIT等顶尖高校的专家学者,以及瑞莱智慧等企业安全技术负责人。他们将围绕超级智能前沿与安全、人工智能红线与安全测评以及技术缓解与控制手段等关键议题进行深入剖析,分享前沿研究成果与实践案例,开展圆桌讨论。


论坛议程

论坛主席



张宏江,清华大学智能产业研究院卓越访问教授、智源研究院前理事长

张宏江博士是国际著名的多媒体计算领域专家、开拓者和意见领袖,在多媒体计算和人工智能领域,尤其是在视频和影像内容分析等研究方面具有开拓性贡献。他拥有超过180项国际专利,出版4本学术专著,发表400多篇学术论文,是世界计算机领域影响因子最高的科学家之一。曾担任IEEE多媒体学刊的主编,是国际计算机协会(ACM)和电气电子工程师协会(IEEE)会士,曾荣获2010IEEE技术成就奖、2012ACM多媒体杰出技术成就奖、2008年度美国杰出亚裔工程师奖。张博士曾任微软亚洲研究院副院长、微软亚太研发集团首席技术官及微软亚洲工程院院长,并曾担任金山集团执行董事及首席执行官兼金山云的首席执行官。他目前担任清华大学智能产业研究院卓越访问教授。




演讲主题及嘉宾介绍

主题一:超级智能前沿与安全

旨报告:Tool AI, the Upside without the Downside

圆桌讨论:超级智能前沿与安全



圆桌讨论嘉宾

张宏江|清华大学智能产业研究院卓越访问教授、智源研究院前理事长
薛   澜|清华大学文科资深教授、苏世民学院院长
国际专家丨麻省理工学院教授
Tegan Maharaj|加拿大魁北克人工智能研究所助理教授
谢旻希|安远AI创始人兼CEO|主持人











薛澜,清华大学苏世民书院院长、国家战略咨询与综合评估特邀委员会委员

薛澜,清华大学文科资深教授、苏世民书院院长、人工智能国际治理研究院院长。研究方向为公共政策与公共管理、科技创新政策、危机管理及全球治理。主要著作有《中国科技发展与政策(1978-2018)》、《国家创新系统的演进与发展》(合著)、《科技全球化与中国发展》(合著)等。






谢旻希,安远AI创始人兼CEO

谢旻希是安远AI的创始人兼CEO,该机构是一家人工智能安全与治理领域的第三方研究和咨询机构,同时是目前该领域中国唯一的社会企业。他现任世界人工智能大会人工智能治理顾问、中国人工智能产业发展联盟(AIIA)安全治理委员会专家,以及牛津大学成立的人工智能治理中心政策研究员。此前,他曾是联合国“高级别人工智能咨询机构”的专业咨询网络成员,并担任过人工智能行业联盟Partnership on AI的高级顾问。





主题二:人工智能红线与安全评测
主旨报告


Tegan Maharaj,加拿大魁北克人工智能研究所助理教授

Tegan Maharaj 博士是加拿大多伦多大学信息学院的助理教授,同时也是 Vector Institute 和 Schwartz-Reisman Institute for Technology and Society 的研究员。她是《新加坡人工智能安全会议》的程序主席之一。她担任《Journal of Machine Learning Research (JMLR)》的执行编辑,并共同创立了 Climate Change AICCAI),该组织致力于推动机器学习在气候变化问题上的应用。在加入多伦多大学之前,Tegan 在蒙特利尔的 Mila 和蒙特利尔理工学院(Polytechnique Montréal)完成了博士学位,师从 Christopher Pal 教授,并获得了加拿大自然科学与工程研究委员会(NSERC)和蒙特利尔人工智能研究所(IVADO)的奖学金。




主旨报告:CBRN高风险场景中的欺骗与自动化决策风险


徐葳,清华大学交叉信息研究院副院长、教授

徐葳是清华大学交叉信息科学研究院教授、副院长。他的研究兴趣广泛,涵盖分布式系统设计、大数据处理、金融科技、数据中心网络、隐私保护计算、大规模机器学习和数据挖掘系统,以及面向实际的大数据应用场景。徐葳于2010年在加州大学伯克利分校获得电子工程与计算机科学博士学位,其博士研究聚焦于通过分析自由文本控制台日志实现问题检测,师从著名计算机科学家David Patterson教授与Armando Fox教授。在加入清华大学之前,他曾在谷歌担任软件工程师两年半,积累了丰富的工业界经验。徐教授的研究融合理论与实践,致力于推动高性能、可扩展且安全的智能计算系统的发展。




主旨报告:前沿AI系统自主复制与欺骗风险:评测与治理



潘旭东,复旦大学计算与智能创新学院副研究员、上海创智学院全时导师

潘旭东博士是复旦大学计算机科学技术学院的助理教授,专注于人工智能安全与安全性研究。他的研究方向包括大语言模型(LLM)和多模态语言模型(MLM)的安全性、集成应用的安全性、智能体安全以及前沿人工智能的安全性等。潘博士在人工智能安全领域发表了多篇顶级会议论文,致力于通过评估、攻击和防御等技术手段,提升人工智能系统的安全性。





主题三:技术缓解与控制手段
主旨报告:Towards Certifying AI Safety and Security


孙军,新加坡管理大学计算与信息学院终身教授

孙军教授于2002年和2006年分别获得新加坡国立大学计算机科学学士和博士学位。2007年,他获得了李光耀博士后奖学金,并于2010年起担任新加坡管理大学终身教授。他的研究领域包括人工智能安全、软件工程和形式化方法,已在多个顶级会议和期刊上发表了250多篇论文。他开发的PAT模型检查器被多家公司用于软件分析,并担任多家公司的资深技术顾问。



主旨报告


Buck Shlegeris,Redwood Research 首席执行官

Buck Shlegeris 是非营利组织 Redwood Research 的首席执行官,该机构专注于人工智能安全与控制研究。他的研究领域涵盖 AI 对齐、可解释性、基于人类反馈的强化学习等,致力于开发评估方法和安全技术,以降低先进 AI 系统的灾难性失控风险。




圆桌讨论:技术缓解与控制手段


圆桌讨论嘉宾

黄民烈|清华大学教授
田   天|瑞莱智慧CEO
孙   军|新加坡管理大学计算与信息学院终身教授
王希廷|中国人民大学副教授
Buck Shlegeris丨Redwood Research 首席执行官
段雅文|安远AI安全研究经理|主持人





黄民烈,清华大学计算机系、人工智能研究院教授

黄民烈是清华大学教授,长期从事人工智能、深度学习和自然语言处理领域的研究工作,尤其专注于自然语言生成理论与模型、多模态基础模型、大语言模型的基础问题,以及情绪理解、心智建模等社会智能相关方向。他在对话系统、情感计算、人机交互等领域具有重要影响力,是中国对话系统研究的领军人物之一。黄教授亦致力于AI对齐、安全与伦理等前沿问题的研究。黄教授领导清华大学对话智能实验室(Conversational AI,简称 CoAI),团队在ACLICLRICMLNeurIPS等国际顶级会议发表论文超过100篇,获得包括COLING 2010最佳论文、ACL 2012最佳学生论文、IJCAI 2018杰出论文、SIGDIAL 2020最佳论文、NLPCC 20152020最佳论文奖、ACL 2023/2024领域主席奖在内的多个重要奖项。代表性研究成果包括Emotional Chatting MachineAAAI 2018)、ESCACL 2021)、PPTACL 2022)、MiniLLMICLR 2024)、ChatGLM2024,与唐杰教授合作)等,部分成果已成为该领域高被引工作。






田天,瑞莱智慧联合创始人兼首席执行官

田天,瑞莱智慧公司创始人、首席执行官,博士毕业于清华大学计算机系人工智能专业,曾荣获清华大学特等奖学金、西贝尔学者称号。 获AI青年科学家联盟“青年AI科学家”、福布斯30岁以下精英、创业邦“30岁以下创业新贵”、 “吴文俊人工智能优秀青年奖”、第五届杰出工程师青年奖等荣誉。





王希廷,中国人民大学高瓴人工智能学院准聘副教授

王希廷本科、博士毕业于清华大学,曾是MSRA社会计算组首席研究员。研究兴趣为可解释、负责任的人工智能,相关科研成果落地全球占有量第二的必应搜索引擎。两篇论文被CCF-A类期刊TVCG评选为封面论文,被邀请担任IJCAIAAAI领域主席,加入IEEE VIS组委会担任档案主席,Visual Informatics编委,被评为AAAI 2021 杰出高级程序委员。两次受邀在SIGIR可解释推荐研讨会上发表主旨演讲,是CCFIEEE高级会员。






段雅文,安远AI安全研究经理

段雅文,现于安远AI担任技术项目经理,致力于AI安全技术社区建设。他也是未来生命研究所AI Existential Safety PhD学者,他曾在多个AI顶会NeurIPS、ICML上组织AI安全相关的工作坊,他参与的研究项目曾在多个AI顶会和工作坊上发表,如CVPR、ECCV、ICML、ACM FAccT、NeurIPS等。他曾在加州大学伯克利分校人机兼容人工智能中心(CHAI)和华为诺亚方舟实验室进行AI研究,拥有剑桥大学机器学习硕士学位,香港大学理学士学位。



成果发布:智源AI安全评测


戴俊韬,北京智源研究院大模型安全中心研究员

戴俊韬,北京智源研究院大模型安全中心研究员。他主要研究方向是强化学习和大模型价值对齐,并在计算机领域顶级会议和期刊上发表了十余篇论文,其中包括三篇口头或亮点论文。他的工作在谷歌学术上获得引用量2千余次,参与开源项目超2万颗星。



即刻扫码注册,参与大会报
本届大会采用线下与线上模式融合,报名通道已开启,欢迎扫码免费注册。由于线下席位有限,请尽早完成注册,组委会将根据注册次序审核,并在会前发送审核结果通知。公开环节将向注册用户全程线上直播。
大会合作、咨询、赞助欢迎联系:press@baai.ac.cn
大会官网 https://2025.baai.ac.cn/
- 往期推荐 -

2025智源大会议程公开|深度推理模型论坛

2025智源大会议程公开|下一代AI路径探索

点击「阅读原文」直达大会官网

内容中包含的图片若涉及版权问题,请及时与我们联系删除