分论坛简介

基础模型和智能体是人工智能的核心技术:基础模型是智能系统的“内核”,提供内在的理解与推理能力;智能体是智能系统的“载体”,提供外在的交互与协作能力。近年来,基础模型和智能体技术快速迭代,已成为推动人工智能发展的核心驱动力。为促进学术交流与技术分享,本次“基础模型与智能体”分论坛将聚焦基础模型与智能体的核心挑战和前沿问题,邀请来自清华大学、中国人民大学、北京智源人工智能研究院的知名专家学者,共同探讨基础模型的前沿进展、智能体系统的创新应用,以及两者融合带来的技术突破与产业变革。

分论坛主席

唐杰,清华大学计算机系WeBank讲席教授、清华大学人工智能研究院基础模型研究中心主任。研究兴趣包括人工智能、超大规模预训练模型。研发了GLM、ChatGLM、CogView、CogVideo、CodeGeeX、Auto GLM等系列模型,获邀在ICLR、WWW上做大会特邀报告。此前还研发了研究者社会网络挖掘系统AMiner,吸引全球220个国家/地区3000多万用户访问。曾获ACM SIGKDD Test-of-Time Award(十年最佳论文)、IEEE ICDM研究贡献奖、国家科技进步二等奖。


刘洋清华大学万国数据教授、智能产业研究院执行院长、计算机科学与技术系副系主任、人工智能医院执行院长、人工智能研究院副院长。研究方向为自然语言处理、智慧医疗和科学智能,承担国家自然科学基金委杰出青年项目、科技创新2030“新一代人工智能”重大项目等重要科研项目,获得国家科技进步二等奖1项、省部级与一级学会科技奖励5项、重要国际会议优秀论文奖4项。主要学术兼职包括中国人工智能学会组织工作委员会主任、中国中文信息学会计算语言学专业委员会主任等。


分论坛讲者&报告简介

报告题目

迈向虚实融合的多模态基础模型

报告摘要

大规模预训练模型具有很强的通用性,本报告将介绍多模态基础模型的一些新进展,包括表述时空一致性的数字内容生成、用于机器人控制的VLA基础模型等,并探讨未来的可能发展方向和关键问题。

讲者简介

朱军,清华大学计算机系Bosch AI教授、IEEE/AAAI Fellow,曾任卡内基梅隆大学兼职教授。主要从事机器学习研究,担任国际著名期刊IEEE TPAMI的副主编,担任ICML、NeurIPS、ICLR等资深领域主席和最佳论文评审委员等。获中国青年科技奖、中国科协求是杰出青年奖、陈嘉庚青年科技奖、科学探索奖、ICLR国际会议杰出论文奖等。

报告题目

具身智能前沿进展与展望

报告摘要

具身智能因其广阔的应用前景,近年来在学术界与工业界引发了广泛关注。当前,以人形机器人为载体的具身智能系统发展迅速,然而整体上仍处于初步探索阶段。本报告旨在以实现通用人工智能(AGI)的具身智能系统为目标,系统梳理其当前发展现状,并探讨未来可能的演进路径。

讲者简介

王业全,北京智源人工智能研究院研究员。“新一代人工智能”国家科技重大专项负责人,海淀青联委员,智源研究院FLM团队负责人,清华大学优秀博士,2022年被评为AI 2000全球最具影响力人工智能学者(自然语言处理领域)。主要从事具身智能和大模型方面的研发工作,代表成果有 FLM系列大模型(Tele-FLM-1T、FLM-101B)、Mu-Scaling、MSG和ATAE-LSTM等。在国际顶级会议发表五十余项研究成果,已获十余项国内外发明专利授权,谷歌学术引用超3,700次。所提出的ATAE-LSTM和RNN-Capsule是细粒度情感分析领域的奠基作,多次被PAPER DIGEST评为最具影响力论文,同时多次入选谷歌学术刊物指标榜单。

报告题目  

AutoGLM: 智能体评测、训练和系统构建

报告摘要

大语言模型不仅展现了强大的语言理解和生成能力,也展现了一定的推理能力和作为自主智能体的潜力。相比此前的对话智能体和基于 workflow 的智能体,自主智能体将实现通用的智能代理能力,走出场景特化的局限性。本次报告将介绍 AutoGLM 项目在基于 GUI 和推理模型的大模型自主智能体的评测、训练和系统构建方面的探索。

讲者简介

智谱 AutoGLM 是一支专注于 AI Agent 研发创新的算法模型研发与产品开发团队,基于 GLM 大模型技术,实现 Phone Use 、Browser Use、Computer Use 和 API Use 的自主智能体。团队已完成了包括 AutoGLM-安卓/Web/沉思,GLM-PC等在内多个应用场景的产品发布上线,使用场景覆盖手机、电脑、网页等多端设备,涵盖生活提效、情感陪伴、深度研究等多个领域方向,在 WebArena、AndroidWorld、AndroidLab 等国际评测基准中达到领先水平。

报告题目

面向医疗的可进化大模型智能体研究

报告摘要

近年来,医疗场景已成为人工智能研究和应用的重要方向,我们主要开展大模型和智能体技术在医疗的研究应用,提升医疗场景的智能化水平。近期,我们开展了名为“Agent Hospital”的研究工作,该工作又被媒体称为“AI医院”。我们通过模拟院内流程,结合大语言模型和少量知识能够实现高质量的虚拟患者病历构建;基于这些患者智能体,我们设计了医生智能体的自主进化方法,不断从成功诊疗案例中总结经验、从失败案例中反思教训,在多个诊疗任务上实现准确率持续提升。在二十多个科室的实验验证上来看,自我进化后的虚拟医生能够在合成数据和MedQA等真实医学测试上获得显著提升。从未来应用来看,患者智能体有望服务医学教育培训,医生智能体则将能够辅助人类医生提升诊疗效率和能力。

讲者简介

马为之,清华大学智能产业研究院(AIR)助理研究员,曾先后于清华大学计算机系获得学士、博士学位并就职博士后。主要研究方向为智能信息获取和智慧医疗。目前已在SIGIR等人工智能顶级会议和Nature Medicine等国际顶级期刊发表论文100余篇,先后获得钱伟长中文信息处理科学技术一等奖(两次)、EMNLP 2024最佳资源奖、SIGIR 2020最佳论文提名奖等国内外奖励。入选清华大学首批“水木学者”计划、第七届中国科协青年人才托举工程,目前担任中国中文信息学会青工委秘书长,ACM TOIS(CCF A类国际期刊)主编助理。

报告题目

LLaDA:大语言模型新范式

报告摘要

本次报告聚焦一个问题:自回归是否是通向当前乃至更高水平的生成式智能的唯一范式?本次报告首先从统一概率建模的视角总结当前基础生成模型的发展,并从这个视角出发指出大语言模型的性质(如可扩展性、指令追随、情景学习、对话、无损压缩)主要来自于生成式准则,而非自回归建模独有。基于这些洞察,介绍扩散语言模型最新进展,包括基础理论、扩展定律、规模训练、价值对齐和多模态理解等。LLaDA系列模型通过非自回归的方式,展示了令人惊讶的可扩展性和多轮对话能力。这些结果不仅挑战了自回归的地位,更加深了我们对生成式人工智能的理解。

讲者简介

李崇轩,中国人民大学高瓴人工智能学院准聘副教授,主要研究领域为生成模型,领导研发扩散语言模型LLaDA,部分成果部署于DALL·E 2、Stable Diffusion、Vidu等行业领先模型。获ICLR杰出论文奖、吴文俊优秀青年奖、北京市科技新星、吴文俊人工智能自然科学一等奖等,主持国家自然基金重大研究计划培育项目等。担任IEEE TPAMI 编委(AE)和ICLR、NeurIPS等国际会议的领域主席(AC)。

报告题目

月之暗面Kimi在预训练的实践

报告摘要

月之暗面Kimi的Scaling团队致力于攻克大语言模型(LLM)预训练中的两大关键问题:长上下文(Long Context)处理能力的提升以及Token效率(Token Efficiency)的最大化。为突破超长上下文处理能力,我们引入了创新的混合块注意力机制——MoBA(Mixture of Block Attention),该机制将混合专家(MoE)思想与稀疏注意力机制相结合,实现了1M超长上下文的高效处理与理解。针对Token效率问题,我们对Muon优化算法进行了针对性改进,使其能够支持规模化的分布式训练,在Moonlight模型训练过程中提升近一倍的Token效率,从而提升模型综合性能并降低训练所需的计算资源成本。本报告将深入探讨上述方法的设计理念、关键实验成果及其对未来大语言模型发展的潜在启示。

讲者简介

杜羽伦,月之暗面Kimi预训练负责人,月之暗面Kimi致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能,实现普惠AI。

报告题目

大模型密度法则与高密度大模型关键技术

报告摘要

2018年以来大模型规模不断增大、产生智能涌现,验证了OpenAI提出的模型规模法则(Scaling Law),特别是ChatGPT的推出引发全世界对大模型技术的关注。面向未来,大模型的发展趋势是什么,就是不断增加模型参数规模以追求更多能力涌现么?本报告发现,大模型在印证规模法则的同时,还呈现能力密度持续增强的规律,我们称为大模型的密度法则(Densing Law),这揭示了端侧智能的巨大潜力,并指出未来应持续探索大模型科学化建设路径,不断改进模型制造工艺,实现人工智能的高质量、可持续发展。本报告将介绍大模型的密度法则和实现高密度大模型的关键技术。

讲者简介

刘知远,清华大学计算机系长聘副教授。主要研究方向为大语言模型、知识工程与社会计算。已在ACL、EMNLP、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文200余篇,Google Scholar统计引用超过6万次。曾获教育部自然科学一等奖(第2完成人)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(第2完成人)、中国中文信息学会汉王青年创新奖,连续四年入选2020-2023年Elsevier中国高被引学者,入选《麻省理工科技评论》中国区35岁以下科技创新35人榜单、中国科协青年人才托举工程。


后续我们将继续更新本次学术年会相关信息,敬请持续关注!


点击下方 关注我们

关次本次年会已发布的其他分论坛预告请查看下方合集:

点赞

分享

收藏

内容中包含的图片若涉及版权问题,请及时与我们联系删除