清华大学计算机系与人工智能研究院基础模型研究中心联合举办首届基础大模型研讨会

2023年9月10日，在第39个教师节当日，首届基础大模型研讨会在清华科技园国际会议中心举办。本次研讨会由清华大学人工智能研究院基础模型研究中心和清华大学计算机系共同举办，旨在为国内外大模型领域的研究人员搭建共同探讨大模型发展的交流平台，为推动大模型研究发展凝聚智慧力量。研讨会受到学术界和产业界广泛关注，共吸引近3000位学者、学生和从业者报名参加。

大会现场

教育部科学技术与信息化司司长雷朝滋出席会议并致辞。中国科学院院士、清华大学人工智能研究院名誉院长、清华大学计算机系教授张钹出席会议并作报告。来自斯坦福大学、Open AI、南加州大学、清华大学等单位的知名大模型研究者与国内外大模型研究者和从业者共同分享、探讨前沿研究和最新热点问题。本次会议由清华大学计算机系党委书记贾珈、清华大学人工智能研究院基础模型研究中心唐杰、黄民烈、刘知远和翟季冬共同主持。

雷朝滋致辞

雷朝滋在致辞中表示，近年来，大模型研究在全球范围内取得了显著进展，为推动人工智能发展提供了强有力的支撑。本次研讨会是清华大学基础模型研究中心成立以来举办的首场学术交流活动，汇聚来自高校、企业、研究机构等国内外各界人士，共同聚焦大模型的前沿研究，探讨未来发展趋势。他希望通过今天的交流和探讨，各位专家学者能够深入交流，产生思想碰撞，推动我国大模型研究取得更多突破，助力人工智能产业的繁荣发展，同时，也希望各位专家学者能够充分发挥自己的聪明才智，为我国人工智能领域的发展建言献策，共同推动我国大模型研究走向世界领先，为推动我国人工智能高质量发展、加快实现高水平科技自立自强做出重要贡献。

张钹院士作报告

张钹院士以《语言大模型（ChatGPT）的本质》为题，对聊天（对话）机器人的发展历史进行回顾，对语言大模型究竟要解决什么问题进行了探讨。张院士通过实例系统介绍了以微软小冰、IBM沃森等为代表的第一、二代聊天机器人的能力，以及以ChatGPT为代表的最新一代语言模型的语言生成能力，分析了人工智能实现对话或聊天的原理和本质，阐释了ChatGPT的性能、原理和局限性，提出应从语言大模型对人类的影响、多模态生成和人工智能治理等三个方面进行思考，把握人工智能历史发展机遇，促进人工智能不断地进步和发展。

贾珈代表为张钹院士献花致敬

报告后，贾珈代表与会嘉宾向年近89岁的张钹院士进行教师节献花。随后，会场300余位嘉宾齐祝张院士身体康健，向仍然奋斗在教学科研一线的张院士致敬！

Michael Bernstein（左）、Jason Wei（中）、Yan Liu（右）在线上作报告

斯坦福大学计算机科学系副教授Michael Bernstein以《生成式智能体：人类行为的交互式模拟》“Generative Agents: Interactive Simulacra of Human Behavior”为题作了特邀报告，他主要介绍了模拟可信人类行为的生成式智能体，分享了在模拟实验中生成式智能体在记忆、消息扩散等方面展现出的能力。来自Open AI的Jason Wei以《大语言模式复兴中的新范式》“New Paradigms in the Large Language Model Renaissance”为题作线上特邀报告，主要探讨了大型语言模型的可扩展性、涌现能力、基于提示的推理及其对人工智能研究的影响。南加州大学计算机科学系教授Yan Liu以《时间序列建模与分析基础模型的前沿》“Frontiers of Foundation Models for Time Series Modeling and Analysis”为题作线上特邀报告，深入讨论了时间序列数据基础模型的可能路径以及时间序列研究的未来方向。

八位学者作报告，从上至下、从左至右依次为孙茂松、唐杰、汪玉、翟季冬、黄民烈、刘知远、刘潇、东昱晓

清华大学计算机系教授、人工智能研究院常务副院长、基础模型研究中心首席科学家孙茂松以《生成式人工智能：思考与挑战》为题作报告，探讨了语言生成模型的特点，以及对语言学研究、对创新人才培养的启示和思考。清华大学计算机系教授唐杰以《大模型时代的认知智能》为题作报告，详细讲解了认知大模型的概念、技术趋势和团队的最新研究进展。清华大学电子工程系主任汪玉以《面向大模型推理的软硬件优化技术》为题作报告，介绍了AI 2.0时代下面向大模型的软硬件协同优化的挑战，并对如何实现AIGC任务的高效计算进行了总结和展望。清华大学计算机系教授翟季冬以《稀疏MoE大模型训练系统实现与优化》为题作报告，主要介绍了在支撑大模型并行训练加速方面的工作，并探讨了MoE大模型的分布式训练。清华大学计算机系教授黄民烈以《大模型安全与超级对齐》为主题作报告，分享了大模型的安全体系和超级对齐理念，探讨了技术如何让模型更加安全、可控。清华大学计算机系长聘副教授刘知远以《大模型系统：迈向通用的人工智能》为题作报告，系统阐释了大模型呈现的显著通用特性，并对大模型迈向通用智能的未来之路进行了探讨。清华大学经管学院长聘副教授刘潇以《GPT经济理性的出现》“The Emergence of Economic Rationality of GPT”为题作报告，分享了以指示GPT在风险、时间、社会和食物偏好四个方面做出预算决策来研究GPT的经济合理性。清华大学计算机系助理教授东昱晓以《xTrimoPGLM-100B:千亿蛋白预训练大模型》为主题作报告，展示了蛋白质预训练生物大模型的技术迭代。

海报展示和交流

在海报展示和交流中，16张精心制作的海报前聚集了很多与会嘉宾。讲解声、交流声环绕在展厅上空，现场学术讨论氛围十分浓厚。

关于我们

清华大学人工智能国际治理研究院（Institute for AI International Governance, Tsinghua University，THU I-AIIG）是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势，研究院面向人工智能国际治理重大理论问题及政策需求开展研究，致力于提升清华在该领域的全球学术影响力和政策引领作用，为中国积极参与人工智能国际治理提供智力支撑。

新浪微博：@清华大学人工智能国际治理研究院

微信视频号：THU-AIIG

Bilibili：清华大学AIIG

来源 | 本文转载自清华大学人工智能研究院基础模型研究中心，点击阅读原文获取更多内容

内容中包含的图片若涉及版权问题，请及时与我们联系删除

清华大学计算机系与人工智能研究院基础模型研究中心联合举办首届基础大模型研讨会

评论列表

评论