卷友们好，我是rumor。

最近在回顾2026年Q2各家大模型的进展，没想到有多达11位考生都交出了自己的答卷。

本以为目前基座技术、发展方向同质化的趋势已经很明显了，但在zoom in的过程中，还是发现了一些有意思的差异。

今天主要抛一些不同的客观维度来审视国内的基座们，分别是：

训练复杂度：预训练数据量、模型尺寸、上下文长度、多模态支持、是否有多种尺寸。模型的feature越多，训练复杂度越高，在展现模型能力潜力的同时，一定程度代表了基模团队近几个月的组织效率、工程能力、算力储备
发布后影响力：以Google Trends为准，拉齐对比所有模型的发布后趋势，一定程度展现了模型的效果和影响力

这些维度的指标不同于benchmark，它们较难hack，不是简单加数据、搞PR就能搞定的事儿。同时很容易查到，且能直接拉平对比，不像SWE等榜单，各家的评测环境都不一样。

训练复杂度

如下图所示。按照打钩数量对模型进行倒排，相同数量则对比发布时间。

从排序结果可以看到，不比Claude和GPT系列，目前国内还没有五星王者的出现。网传Deepseek 7月份会发布多模态版本，极有可能是第一个上王者的国内模型。

四星模型中，DeepSeek仍旧是基模团队综合实力上的王者，小米也凭借年轻且高效的组织效率名列前茅，这点从之前罗福莉的采访也可以感受到。MiMo-V2.5-Pro预训练27T数据，下一版增训多模的话很快也能上王者了。

三星模型中，Qwen 3.7 Max和Plus是闭源，极有可能上四星；Minimax-M3没公布明确的预训练数据量，但网传训了100T数据；Kimi-K2.7-Code上下文长度还有空间；美团LongCat-2.0是近期刚崛起的新星，虽然25年9月才正式发布第一款LongCat-Flash模型，但从模型的复杂度来看其基模团队的能力丝毫不亚于其他团队。

二星模型中，GLM-5.0已有28.5T数据，估计5.2已经超了。GLM-5.2主要由于尺寸略小少得一星，虽然复杂度不位于前列，但其能力已经全球有目共睹，其清华班底的团队实力也不必多言，相信很快就会带来更好的版本；Seed2.1是闭源模型，能查到的信息有限，但预训练数据量和模型尺寸大概率不输其他模型。

发布后影响力

拉齐二季度这些模型发布后一段时间的Google Trends，头部模型非常明显：DeepSeek V4一骑绝尘、GLM 5.2位居第二，MiniMax M3位居第三：

但也可以看到，DeepSeek V4和MiniMax M3在发布后迅速冲高但又迅速回落，而GLM 5.2则经历了一波发酵后迎来第二次波峰，且至今仍保持一定的讨论度，这也跟大部分业内人士的观感类似。

注：为了贴合大部分人的打字习惯，且标准化，这里关键词都写模型全称，词以空格分隔，另外大小写不影响趋势

去掉前三名后，我们来看后面8个模型，按关键词波峰排序分别是：

Qwen、Kimi虽然近期讨论度有所下降，但依旧在全球有着一定影响力；MiMo的势头非常猛，仔细看曲线图可以发现，MiMo、ERNIE这两个模型是有二次发酵的过程的，而且MiMo非常猛的点在于，它4.23发布之后，在5.27号宣布调价又迎来了更高的流量峰值，6.9号的1000 tokens/s新闻也有一个小波峰，可见对一款模型的价格、速度继续优化，和版本迭代一样受用户关注。

值得注意的是，LongCat 2.0是一款6.30才发布的模型，但截至当日热度已呈明显的上升趋势，该模型是全球首个使用国产芯片进行了全流程训练的模型，且具备较高的复杂度（1.6T参数量、35T+预训练语料、1M长文），同时该模型已用OWL名称在OpenRouter上榜多日，影响力的发酵仍有较大潜力。

总结

实际上，模型的发布不是终点，而是起点。

从发布那一刻起，基模团队便开始正式面对市场和用户的考验，即使这一版做的拉垮，下一版也可能逆风翻盘。也有可能这一版人上人，下一版却不尽人意。

今天我列的这些客观指标不能完全代表团队能力与模型影响力，只是中国模型在当前时刻的一个切片。

如果和Claude Fable对比，仍有一星的复杂度和一倍的影响力差距：

但好的一面是，我们足够快足够卷，从23年开始的代际差，到最近让他们纠结封还是不封。

26年的Q2，有十一位选手已加入战场，早晚有上王者的一天。

我是朋克又极客的AI算法小姐姐rumor

大模型算法研究员，谷歌开发者专家

欢迎关注我，带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

「反正就是要上王者」

参考资料

LongCat 2.0: https://longcat.ai/blog/longcat-2.0/
Seed2.1: https://seed.bytedance.com/zh/blog/seed2-1-officially-released-advancing-ai-productivity
GLM-5.2: https://z.ai/blog/glm-5.2
Kimi-2.7-Code: https://platform.kimi.com/docs/guide/kimi-k2-7-code-quickstart
Step 3.7 Flash: https://platform.stepfun.com/docs/zh/guides/models/step-3.7-flash
Minimax-M3: https://www.minimaxi.com/blog/minimax-m3
Qwen-3.7-Plus: https://qwen.ai/blog?id=qwen3.7-plus
ERNIE 5.1: https://yiyan.baidu.com/blog/posts/ernie-5.1-0508-release/
DeepSeek-V4: https://arxiv.org/html/2606.19348v1
MiMo-V2.5-Pro: https://mimo.xiaomi.com/mimo-v2-5-pro/
MiMo-V2.5: https://mimo.xiaomi.com/mimo-v2-5/
HY3 Preview: https://hy.tencent.com/research/hy3-preview

内容中包含的图片若涉及版权问题，请及时与我们联系删除

换个还没被hack的指标，重新审视Q2登场的11位模型

训练复杂度

发布后影响力

总结

评论列表

评论