卷友们好,我是rumor。

最近在回顾2026年Q2各家大模型的进展,没想到有多达11位考生都交出了自己的答卷。

本以为目前基座技术、发展方向同质化的趋势已经很明显了,但在zoom in的过程中,还是发现了一些有意思的差异。

今天主要抛一些不同的客观维度来审视国内的基座们,分别是:

  1. 训练复杂度:预训练数据量、模型尺寸、上下文长度、多模态支持、是否有多种尺寸。模型的feature越多,训练复杂度越高,在展现模型能力潜力的同时,一定程度代表了基模团队近几个月的组织效率、工程能力、算力储备
  2. 发布后影响力:以Google Trends为准,拉齐对比所有模型的发布后趋势,一定程度展现了模型的效果和影响力

这些维度的指标不同于benchmark,它们较难hack,不是简单加数据、搞PR就能搞定的事儿。同时很容易查到,且能直接拉平对比,不像SWE等榜单,各家的评测环境都不一样。

训练复杂度

如下图所示。按照打钩数量对模型进行倒排,相同数量则对比发布时间。

从排序结果可以看到,不比Claude和GPT系列,目前国内还没有五星王者的出现。网传Deepseek 7月份会发布多模态版本,极有可能是第一个上王者的国内模型。

四星模型中,DeepSeek仍旧是基模团队综合实力上的王者,小米也凭借年轻且高效的组织效率名列前茅,这点从之前罗福莉的采访也可以感受到。MiMo-V2.5-Pro预训练27T数据,下一版增训多模的话很快也能上王者了。

三星模型中,Qwen 3.7 Max和Plus是闭源,极有可能上四星;Minimax-M3没公布明确的预训练数据量,但网传训了100T数据;Kimi-K2.7-Code上下文长度还有空间;美团LongCat-2.0是近期刚崛起的新星,虽然25年9月才正式发布第一款LongCat-Flash模型,但从模型的复杂度来看其基模团队的能力丝毫不亚于其他团队。

二星模型中,GLM-5.0已有28.5T数据,估计5.2已经超了。GLM-5.2主要由于尺寸略小少得一星,虽然复杂度不位于前列,但其能力已经全球有目共睹,其清华班底的团队实力也不必多言,相信很快就会带来更好的版本;Seed2.1是闭源模型,能查到的信息有限,但预训练数据量和模型尺寸大概率不输其他模型。

发布后影响力

拉齐二季度这些模型发布后一段时间的Google Trends,头部模型非常明显:DeepSeek V4一骑绝尘、GLM 5.2位居第二,MiniMax M3位居第三:

但也可以看到,DeepSeek V4和MiniMax M3在发布后迅速冲高但又迅速回落,而GLM 5.2则经历了一波发酵后迎来第二次波峰,且至今仍保持一定的讨论度,这也跟大部分业内人士的观感类似。

注:为了贴合大部分人的打字习惯,且标准化,这里关键词都写模型全称,词以空格分隔,另外大小写不影响趋势

去掉前三名后,我们来看后面8个模型,按关键词波峰排序分别是:

Qwen、Kimi虽然近期讨论度有所下降,但依旧在全球有着一定影响力;MiMo的势头非常猛,仔细看曲线图可以发现,MiMo、ERNIE这两个模型是有二次发酵的过程的,而且MiMo非常猛的点在于,它4.23发布之后,在5.27号宣布调价又迎来了更高的流量峰值,6.9号的1000 tokens/s新闻也有一个小波峰,可见对一款模型的价格、速度继续优化,和版本迭代一样受用户关注

值得注意的是,LongCat 2.0是一款6.30才发布的模型,但截至当日热度已呈明显的上升趋势,该模型是全球首个使用国产芯片进行了全流程训练的模型,且具备较高的复杂度(1.6T参数量、35T+预训练语料、1M长文),同时该模型已用OWL名称在OpenRouter上榜多日,影响力的发酵仍有较大潜力。

总结

实际上,模型的发布不是终点,而是起点。

从发布那一刻起,基模团队便开始正式面对市场和用户的考验,即使这一版做的拉垮,下一版也可能逆风翻盘。也有可能这一版人上人,下一版却不尽人意。

今天我列的这些客观指标不能完全代表团队能力与模型影响力,只是中国模型在当前时刻的一个切片

如果和Claude Fable对比,仍有一星的复杂度和一倍的影响力差距

但好的一面是,我们足够快足够卷,从23年开始的代际差,到最近让他们纠结封还是不封。

26年的Q2,有十一位选手已加入战场,早晚有上王者的一天



我是朋克又极客的AI算法小姐姐rumor
大模型算法研究员,谷歌开发者专家
欢迎关注我,带你学习带你肝
一起在人工智能时代旋转跳跃眨巴眼


「反正就是要上王者」


参考资料

  • LongCat 2.0: https://longcat.ai/blog/longcat-2.0/
  • Seed2.1: https://seed.bytedance.com/zh/blog/seed2-1-officially-released-advancing-ai-productivity
  • GLM-5.2: https://z.ai/blog/glm-5.2
  • Kimi-2.7-Code: https://platform.kimi.com/docs/guide/kimi-k2-7-code-quickstart
  • Step 3.7 Flash: https://platform.stepfun.com/docs/zh/guides/models/step-3.7-flash
  • Minimax-M3: https://www.minimaxi.com/blog/minimax-m3
  • Qwen-3.7-Plus: https://qwen.ai/blog?id=qwen3.7-plus
  • ERNIE 5.1: https://yiyan.baidu.com/blog/posts/ernie-5.1-0508-release/
  • DeepSeek-V4: https://arxiv.org/html/2606.19348v1
  • MiMo-V2.5-Pro: https://mimo.xiaomi.com/mimo-v2-5-pro/
  • MiMo-V2.5: https://mimo.xiaomi.com/mimo-v2-5/
  • HY3 Preview: https://hy.tencent.com/research/hy3-preview

内容中包含的图片若涉及版权问题,请及时与我们联系删除