2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制航图。报名通道已开启


2025北京智源大会倒计时:22 

深度推理模型 论坛丨6月7日 下午


近年来,推理模型在自然语言处理、复杂决策系统、跨领域知识融合等前沿领域取得了一系列颠覆性突破,正引领人工智能研究与产业从感知智能迈向认知智能与决策智能。为系统性剖析深度推理模型的理论创新、工程挑战与产业应用,本次论坛特别邀请国内顶尖科研院所、行业领军企业的8位一线研究者,分别针对各自擅长的议题进行主旨报告,并将在报告后通过圆桌形式对推理模型领域的热点问题进行深入讨论,解码深度推理模型从学术前沿到产业落地的完整技术链路正引领人工智能从感知智能迈向认知智能与决策智能的深度融合阶段。


论坛议程

论坛主席&主持人



赵鑫,中国人民大学教授

赵鑫,现为中国人民大学高瓴人工智能学院教授,2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,特别关注大模型预训练与深度推理研究,谷歌学术引用3.2万余次,曾主导研发了玉兰系列大语言模型,推动慢思考推理项目STILL系列工作,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书(高等教育出版社出版)。曾荣获CCF-IEEE CS青年科学家奖、吴文俊人工智能优秀青年奖、ECIR时间检验奖。





宋睿华,中国人民大学副教授

宋睿华,国家高层次人才特聘教授,现任中国人民大学高瓴人工智能学院长聘副教授。曾任微软亚洲研究院主管研究员、微软小冰首席科学家。近期研究兴趣为多模态理解、创作和交互。发表学术论文100余篇,申请专利30余项。曾获WWW 2004最佳论文提名奖,AIRS 2012最佳论文奖和CLWS 2019优秀论文奖,2022年度教育部自然科学一等奖。她的算法完成了人类史上第一本人工智能创作的诗集《阳光失了玻璃窗》



演讲主题及嘉宾介绍
(按照发言先后顺序)

1.原生稀疏注意力机制:关注硬件的原生可训练稀疏注意力大模型



袁境阳,北京大学博士&DeepSeek

袁境阳是北京大学计算机学院博士生。主要研究方向是高效大语言模型和稀疏注意力机制,在DeepSeek实习期间提出了原生稀疏注意力模型(NSA)等高效大模型架构。曾获北京市优秀毕业生、北京大学优秀毕业生等荣誉。



2.强化学习驱动的推理模型:密集奖励、策略熵和自演化



丁宁,清华大学电子工程系助理教授

丁宁,清华大学电子工程系助理教授,研究方向为人工智能,尤其注重探究通用智能和专业推理能力的理论、算法和系统,并致力于将其应用到创新科学发现中。他在Nature Machine IntelligenceICLRNeurIPSICMLACL等人工智能会议和期刊发表多篇论文,谷歌学术引用量超过7000次,主导的开源成果在GitHub上获得超过25000星标。他曾入选中国科协青年人才托举工程,获ACL最佳系统演示论文奖、世界人工智能大会青年优秀论文奖和云帆奖、中国算力大会最佳学术论文奖、清华大学优秀博士论文、百度奖学金、Stanford全球前2%科学家等荣誉。他最近提出融合密集奖励的强化学习方法PRIME、测试时强化学习TTRL等工作。




3.面向大模型的大规模强化学习系统


吴翼,清华大学交叉信息研究院助理教授

吴翼,清华大学交叉信息研究院(IIIS)助理教授,于2019年在美国加州大学伯克利分校获得博士学位,并曾任OpenAI全职研究员,研究领域为深度强化学习和多智能体学习。代表作包括强化学习泛化性早期工作Value Iteration Network,多智能体学习最高引算法 MAPPO/MADDPG,OpenAI多智能体捉迷藏项目等,还曾获得顶级会议NIPS 2016 best paper award(最佳论文奖)和ICRA2024 best demo award finalist(最佳演示奖决赛入围奖)。




4.世界模型与决策推理


俞杨,南京大学人工智能学院教授

俞扬,南京大学人工智能学院教授。主要从事人工智能、机器学习、强化学习方向的研究,工作获5项国际论文奖、3项国际算法竞赛冠军。入选国家青年人才计划、IEEE Intelligent Systems “AI’s 10 to Watch”,获CCF-IEEE青年科学家奖,首届亚太数据挖掘“青年成就奖”,并受邀在国际人工智能联合大会 IJCAI 2018上作“青年亮点报告”。




5.生成式AI第二幕:认知工程




刘鹏飞,上海交通大学副教授

刘鹏飞是上海交通大学副教授、创智学院导师、清源研究院院长助理,国家海外优青。专注于自然语言的预训、复杂推理等研究方向;谷歌学术引用19000余次。提示工程(Prompt Engineering)概念最早提出者之一,单篇引用超过5000余次。曾获得首届蚂蚁InTech科技奖等。代表作o1 journey,LIMA, LIMO等。



6.推理模型驱动的深度信息获取


窦志成,中国人民大学教授

窦志成,教授,博士生导师,中国人民大学高瓴人工智能学院副院长,负责中国人民大学人工智能本硕博人才培养。担任中国计算机学会大数据专家委员会秘书长,中国中文信息学会理事,信息检索专委会副主任,CCF大模型论坛常务委员,中文信息学会大模型专家委员会委员。主要研究方向为大模型、AI搜索、智能体、司法智能等,在国际知名学术会议和期刊上发表论文100余篇,是中国人民大学涉外法治大模型的核心研发者,主持开发大模型检索增强工具包FlashRAG获得星标2000余枚。曾获教育部自然科学奖一等奖、国际信息检索大会最佳论文提名奖,国际万维网大会亮点论文奖,亚洲信息检索大会最佳论文奖,全国信息检索学术会议最佳论文奖等奖励。担任CCF中国数据大会程序主席、中国大数据学术会议组织主席、全国信息检索学术会议大会主席等。



7.主题演讲


张志强,蚂蚁集团基础智能部技术总监

张志强,蚂蚁集团基础智能部技术总监、资深算法专家,主要研究方向包括大语言模型、图机器学习、知识图谱等,负责蚂蚁集团多个智能系统建设,包括“百灵”大语言模型Ling、超大规模图学习系统AGL、工业知识图谱平台“知蛛”等。相关技术成果在NeurIPS、VLDB、SIGKDD、ACL等CCF A/B类国际会议期刊发表论文80余篇,授权发明专利40余项,获吴文俊人工智能科技进步一等奖(2020)和电子学会科学技术奖-科技进步一等奖(2022)。




8.通过强化学习提升推理模型的性能和效率


何俊贤,香港科技大学助理教授

何俊贤是香港科技大学计算机科学与工程系助理教授。他于2022年从卡内基梅隆大学计算机学院获得自然语言处理领域的博士学位。他最近的研究重点是大模型推理。他担任ICLR、ACL和EMNLP的领域主席。代表作有Unify-PEFT, C-Eval, CodeIO, SimpleRL等。



圆桌讨论|深度推理模型前沿进展


圆桌嘉宾:

俞   扬丨南京大学人工智能学院教授

丁   宁丨清华大学助理教授

刘鹏飞丨上海交通大学副教授

窦志成丨中国人民大学高瓴人工智能学院副院长

张志强丨蚂蚁集团基础智能部技术总监

何俊贤丨香港科技大学助理教授

主持人丨宋睿华丨中国人民大学副教授




即刻扫码注册,参与大会报名
本届大会采用线下与线上模式融合,报名通道已开启,欢迎扫码免费注册。由于线下席位有限,请尽早完成注册,组委会将根据注册次序审核,并在会前发送审核结果通知。公开环节将向注册用户全程线上直播。
大会合作、咨询、赞助欢迎联系:press@baai.ac.cn
大会官网 https://2025.baai.ac.cn/

本文版权归智源社区所有

内容中包含的图片若涉及版权问题,请及时与我们联系删除