点击蓝字
关注我们

第一,前沿模型的迭代周期已从季度推进至月度。OpenAI GPT-5.5距GPT-5.4正式上线仅约六周;国内DeepSeek-V4、Kimi K2.6、字节Seed3D 2.0、商汤Sage四款模型在五个工作日内集中发布。
第二,多家厂商表态将切换产品形态,从对话Chatbot切换为自主智能体Agent。OpenAI在GPT-5.5官方发布稿中将其定位为"一种新的电脑工作方式";月之暗面把K2.6支持12小时连续执行、协调300个子Agent作为核心传播点;Google Cloud Next将企业入口从聊天框直接切换为Agent平台。
第三,算力供给端的超大规模云厂商与前沿实验室进一步垂直绑定。 Google在72小时内完成三件事:向Anthropic追加最高400亿美元投资、与Anthropic和博通签订5GW TPU协议、发布第八代TPU 8t与8i。


4月27日,外商投资安全审查工作机制办公室(国家发展改革委)发布安全审查决定,依法依规对外资收购Manus项目作出禁止投资决定,要求当事人撤销该收购交易。这是自2024年《外商投资安全审查办法》实施以来,国家针对AI领域跨境并购作出的首例公开禁止投资决定。


4月24日,深度求索(DeepSeek)正式发布并开源新一代前沿大模型DeepSeek-V4预览版本,包含V4-Pro与V4-Flash两款规格。V4-Pro采用1.6万亿总参数、单token激活490亿参数的Mixture-of-Experts架构;V4-Flash面向轻量化部署,总参数2840亿、单token激活130亿。这是DeepSeek继2025年初V3系列引发全球关注后,时隔约一年发布的新一代主力模型。
模型能力层面,V4-Pro在Agent任务、世界知识与复杂推理三项基准上达到国内领先并位居开源模型第一梯队,部分基准追平闭源旗舰。但本次发布更具产业意义的是同步公开的技术报告披露:V4模型的细粒度专家并行(fine-grained Expert Parallelism, EP)方案已在英伟达GPU与华为昇腾NPU两个平台上完成全栈验证,相较强力的非融合基线方案,分别实现1.50倍至1.73倍的端到端推理加速。这是国产前沿大模型首次在国产算力平台上达到与国际主流硬件相当的生产可用性能。华为同日确认其Ascend 950处理器已支持V4模型部署。
在配套工程说明中,DeepSeek团队披露了产能与定价路线图:受限于当前可获得的高端算力规模,V4-Pro的对外服务吞吐能力短期内仍处于受限状态,主要面向企业级用户与战略合作伙伴优先开放;预计2026年下半年华为昇腾950超节点批量上市后,V4-Pro服务价格将出现大幅下调,并在更大规模上对开发者社区开放。


4月23日,OpenAI正式发布GPT-5.5,并于次日在API向Pro、Business与Enterprise级开发者开放GPT-5.5与GPT-5.5 Pro两款规格。本次发布距GPT-5.4正式上线仅约六周,是OpenAI进入GPT-5系列以来最快的一次迭代节奏。GPT-5.5在Terminal-Bench 2.0、FrontierMath等多项基准上领先同期主要闭源模型。
API定价方面,GPT-5.5为每百万输入token 5美元、每百万输出token 30美元,GPT-5.5 Pro则进一步上探至每百万输入30美元、每百万输出180美元,相较GPT-5.4基础档位约翻倍。
OpenAI在官方发布稿中将GPT-5.5定义为"一种新的电脑工作方式"。区别于此前以"回答用户问题"为核心的产品形态,GPT-5.5被定位为可在企业工作流中自主完成"代码编写与调试、在线研究、数据分析、文档与电子表格生成、跨工具操作直至任务完成"的端到端智能体。在产品层面,OpenAI同步将GPT-5.5接入ChatGPT与Codex体系,并面向Plus及以上付费用户全面铺开。


4月24日,Google母公司Alphabet宣布将向Anthropic追加规模高达400亿美元的新一轮战略投资,其中100亿美元以现金形式即刻到位,按3500亿美元的估值进行投资;另外300亿美元在Anthropic完成后续业绩里程碑后释放。
本次合作中,Google同步扩大与博通(Broadcom)的算力协作,重点支持Anthropic下一代模型的训练与推理基础设施建设;Anthropic的Claude系列模型将进一步在Google Cloud企业市场获得优先推广位次。这是Anthropic自2025年Amazon追加最高250亿美元投资之后,年内第二次接受超大规模战略注资。
Anthropic自身的财务表现是本次合作的重要背景,据公司4月6日官方公告披露,Anthropic的年化经常性收入在2026年4月已突破300亿美元,相较2025年底约90亿美元水平实现三倍以上增长。其主要驱动力来自Claude在企业级编码、智能体、长上下文任务上的深度部署;公司同时披露年度合同金额超过100万美元的企业客户数已超过1000家,相较2026年2月翻倍。当前,微软已通过累计超过130亿美元投资与OpenAI形成深度绑定;亚马逊以最高250亿美元规模成为Anthropic战略股东;谷歌本轮加码后,事实上与Anthropic形成"双绑定"结构。


4月22日至23日举行的Google Cloud Next 2026年度大会上,Google同时完成两项重大发布:第七代TPU"Ironwood"正式进入通用可用阶段(GA),并预览第八代TPU架构TPU 8t与TPU 8i。
这是Google自2016年首次推出张量处理单元(Tensor Processing Unit)以来发布的第八代产品,也是首次按"训练-推理"双轨道分立架构进行产品化的TPU系列。Google宣称TPU 8t相较Ironwood可提供约2.8倍训练性价比、TPU 8i可提供约80%推理性价比提升,两款芯片预计在2027年陆续上市。配合4月初,博通向SEC提交的8-K公告披露的与Google签订的为期五年(至2031年)的TPU定制供应协议,Google已在客户级AI芯片领域建立从研发、设计、制造到云端部署的完整闭环。
Cloud Next大会的另一主线是Google向"AI智能体(Agent)成为企业默认入口"战略全面切换。Google展示了基于Gemini系列与Claude系列的多智能体协同企业应用方案,并将Gemini Enterprise Agent Platform、Agentspace、Vertex AI Agent Builder等工具明确定位为面向Fortune 500客户的"企业级智能体操作系统"层级产品。这意味着Google在"基础模型-算力底座-企业Agent入口"三个维度同时下注。


4月22日,商汤科技旗下绝影团队正式发布端侧多模态智能体基座大模型"Sage"。Sage采用MoE混合专家架构,总参数32B、激活参数仅3B,已在英伟达Orin X车端平台实现部署,是行业首款在车端实现复杂智能体能力的基座大模型。
Sage已与多家头部主机厂达成合作,并于4月24日北京车展期间随Sage Box(千机智盒)三层架构(Sage端侧模型+千机AIOS+New Member原生智能体)一同进入旗舰车型量产环节。
4月23日,字节跳动Seed团队发布3D生成大模型Seed3D 2.0。从应用场景看,Seed3D 2.0直接面向游戏、影视、电商、虚拟现实、工业设计等需要批量3D内容生产的行业,预计将显著降低3D内容创作门槛与单位成本。该模型采用Coarse-to-Fine两阶段Diffusion Transformer(DiT)策略,将"整体结构"与"几何细节"解耦优化,在锐利边缘、薄壁结构与复杂拓扑等关键难点上取得明显突破。


4月20日至21日,月之暗面(Moonshot AI)将其Kimi K2.6从此前的Code Preview分支转为正式可用版本,并同步在全平台上线。此次发布距Kimi K2.6 Code Preview首次公开仅相隔约一周,反映出Moonshot AI在编码与智能体能力方向上的快速迭代节奏。
K2.6的核心定位是"长程自主执行"导向的智能体模型,主要技术特征集中在三方面:其一,K2.6支持单次会话维度的12小时自主编码,模型可在数千步操作链上保持目标导向、自主完成完整工程任务而无需人工干预;其二,平台原生支持300-Agent级别的群体协作(Agent Swarm),主控Agent可协调多达300个子Agent并行处理子任务、跨步协调约4000步;其三,模型在重构遗留代码、生成全栈应用、跨语言协作等"真实工程目标"任务上的可用性显著提升。Moonshot公布的内部基准显示,K2.6在SWE-Bench Pro得分58.6、Humanity's Last Exam(含工具调用)得分54.0,两项均超越同期主要闭源旗舰,跻身全球第一梯队。
K2.6的发布与本周DeepSeek-V4在Agent能力维度的突破构成对照:两款国产开源前沿模型在五个工作日内分别从"通用前沿能力"与"长程工程执行"两个方向,把开源智能体的可用性推到了与美国闭源旗舰相当甚至局部领先的水平。
周报编辑|李承兴
审核|赵杨博
终审|梁正 王净宇





内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢