NEW

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

GLM-4. 5 Team ,

: ,

Aohan Zeng ,

Xin Lv ,

Qinkai Zheng ,

Zhenyu Hou ,

Bin Chen ,

Chengxing Xie ,

Cunxiang Wang ,

Da Yin ,

Hao Zeng ,

Jiajie Zhang ,

Kedong Wang ,

Lucen Zhong ,

Mingdao Liu ,

Rui Lu ,

Shulin Cao ,

Xiaohan Zhang ,

Xuancheng Huang ,

Yao Wei ,

Yean Cheng ,

Yifan An ,

Yilin Niu ,

Yuanhao Wen ,

Yushi Bai ,

Zhengxiao Du ,

Zihan Wang ,

Zilin Zhu ,

Bohan Zhang ,

Bosi Wen ,

Bowen Wu ,

Bowen Xu ,

Can Huang ,

Casey Zhao ,

Changpeng Cai ,

Chao Yu ,

Chen Li ,

Chendi Ge ,

Chenghua Huang ,

Chenhui Zhang ,

Chenxi Xu ,

Chenzheng Zhu ,

Chuang Li ,

Congfeng Yin ,

Daoyan Lin ,

Dayong Yang ,

Dazhi Jiang ,

Ding Ai ,

Erle Zhu ,

Fei Wang ,

Gengzheng Pan ,

Guo Wang ,

Hailong Sun ,

Haitao Li ,

Haiyang Li ,

Haiyi Hu ,

Hanyu Zhang ,

Hao Peng ,

Hao Tai ,

Haoke Zhang ,

Haoran Wang ,

Haoyu Yang ,

He Liu ,

He Zhao ,

Hongwei Liu ,

Hongxi Yan ,

Huan Liu ,

Huilong Chen ,

Ji Li ,

Jiajing Zhao ,

Jiamin Ren ,

Jian Jiao ,

Jiani Zhao ,

Jianyang Yan ,

Jiaqi Wang ,

Jiayi Gui ,

Jiayue Zhao ,

Jie Liu ,

Jijie Li ,

Jing Li ,

Jing Lu ,

Jingsen Wang ,

Jingwei Yuan ,

Jingxuan Li ,

Jingzhao Du ,

Jinhua Du ,

Jinxin Liu ,

Junkai Zhi ,

Junli Gao ,

Ke Wang ,

Lekang Yang ,

Liang Xu ,

Lin Fan ,

Lindong Wu ,

Lintao Ding ,

Lu Wang ,

Man Zhang ,

Minghao Li ,

Minghuan Xu ,

Mingming Zhao ,

Mingshu Zhai ,

Pengfan Du ,

Qian Dong ,

Shangde Lei ,

Shangqing Tu ,

Shangtong Yang ,

Shaoyou Lu ,

Shijie Li ,

Shuang Li ,

Shuang-Li ,

Shuxun Yang ,

Sibo Yi ,

Tianshu Yu ,

Wei Tian ,

Weihan Wang ,

Wenbo Yu ,

Weng Lam Tam ,

Wenjie Liang ,

Wentao Liu ,

Xiao Wang ,

Xiaohan Jia ,

Xiaotao Gu ,

Xiaoying Ling ,

Xin Wang ,

Xing Fan ,

Xingru Pan ,

Xinyuan Zhang ,

Xinze Zhang ,

Xiuqing Fu ,

Xunkai Zhang ,

Yabo Xu ,

Yandong Wu ,

Yida Lu ,

Yidong Wang ,

Yilin Zhou ,

Yiming Pan ,

Ying Zhang ,

Yingli Wang ,

Yingru Li ,

Yinpei Su ,

Yipeng Geng ,

Yitong Zhu ,

Yongkun Yang ,

Yuhang Li ,

Yuhao Wu ,

Yujiang Li ,

Yunan Liu ,

Yunqing Wang ,

Yuntao Li ,

Yuxuan Zhang ,

Zezhen Liu ,

Zhen Yang ,

Zhengda Zhou ,

Zhongpei Qiao ,

Zhuoer Feng ,

Zhuorui Liu ,

Zichen Zhang ,

Zihan Wang ,

Zijun Yao ,

Zikang Wang ,

Ziqiang Liu ,

Ziwei Chai ,

Zixuan Li ,

Zuodong Zhao ,

Wenguang Chen ,

Jidong Zhai ,

Bin Xu ,

Minlie Huang ,

Hongning Wang ,

Juanzi Li ,

Yuxiao Dong ,

Jie Tang

热度 20

2025年08月08日

简介

我们推出了GLM-4.5，这是一款开源的混合专家（Mixture-of-Experts，MoE）大语言模型，总参数量为3550亿，激活参数量为320亿。该模型采用了支持“思考模式”和“直接回答模式”的混合推理方法。通过对23万亿个token进行多阶段训练，并结合专家模型迭代与强化学习的全面后期训练，GLM-4.5在代理（agentic）、推理和代码（ARC）任务中表现出色，在TAU-Bench上得分为70.1%，在AIME 24上得分为91.0%，在SWE-bench Verified上得分为64.2%。相比一些竞品模型，GLM-4.5的参数量少得多，但在所有评估模型中整体排名第三，在代理类基准测试中排名第二。为了推动推理与代理型AI系统的研究，我们公开发布了GLM-4.5（3550亿参数）以及一个精简版本GLM-4.5-Air（1060亿参数）。相关代码、模型及更多信息请访问：https://github.com/zai-org/GLM-4.5。
作者讲解·1
- 讲解视频
- 相关报道(1)
图表
解决问题

论文旨在解决大语言模型在推理和代理任务中性能不足的问题，同时尝试通过参数效率高的方法实现强大的模型表现。这是一个当前人工智能领域的重要问题，尤其是在如何在降低计算资源需求的同时保持高性能。
关键思路

论文提出了一种基于混合专家（MoE）架构的新型大语言模型GLM-4.5，其具有3550亿总参数但每次仅激活320亿参数。其关键创新在于引入了一种混合推理方法，支持“思考”模式和“直接响应”模式。此外，论文通过多阶段训练和强化学习策略进一步提升了模型在推理、代理和编码任务上的表现。
其它亮点

1. GLM-4.5在TAU-Bench、AIME 24和SWE-bench Verified上分别取得了70.1%、91.0%和64.2%的优异成绩 2. 尽管参数量少于多个竞争模型，GLM-4.5在所有评估模型中排名第三，在代理基准测试中排名第二 3. 推出轻量版本GLM-4.5-Air（1060亿参数），便于研究和部署 4. 论文基于23万亿token进行多阶段训练，并采用专家模型迭代和强化学习进行后训练 5. 模型和代码已开源（https://github.com/zai-org/GLM-4.5），有助于推动社区研究
相关研究

1. DeepSeekMoE: A Stale-Gradient Tolerant Mixture-of-Experts Training Approach 2. Switch Transformers: Scaling and Serving with Increased Sparsity 3. GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding 4. MoE-BERT: Training Dense-to-Sparse Megamodules with Mixture of Experts 5. GLM-130B: An Open Bilingual Pre-trained Model for 100+ Languages

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问