【AI治理周报·4月第3期】斯坦福报告称中美AI差距缩至2.7%，中国最大AI4S计算集群落地郑州

点击蓝字

关注我们

斯坦福 HAI 发布《2026 人工智能指数报告》：中美 AI 差距缩至 2.7%

斯坦福大学以人为本人工智能研究院（HAI）

2026世界互联网大会亚太峰会在港开幕，聚焦AI赋能与安全治理

央视新闻

中国最大 AI4S 计算集群落地郑州

央广网

国务院印发《关于推进服务业扩能提质的意见》，首次明确"支持采购大模型、智能体服务"

新华网

中国AI大模型周调用量环比降23.8%，美国近两个月来首次反超

每日经济新闻

Anthropic 发布 Claude Opus 4.7：编程能力登顶全球，视觉推理率达 98.5%

Anthropic官网

Anthropic 官方正式推出身份验证功能：不支持中国大陆证件，中国用户无法完成核验

新浪财经

1. 斯坦福 HAI 发布《2026 人工智能指数报告》：中美 AI 差距缩至 2.7%

2026年4月13日，斯坦福大学以人为本人工智能研究所（HAI）发布第九版《2026年人工智能指数报告》，全文长达423页，覆盖技术性能、经济影响、劳动力结构、科学应用、公众认知与全球治理九大维度，是目前全球覆盖面最广、数据来源最独立的AI年度追踪文献之一，多年来已被美国、欧盟等多国政府、智库和媒体广泛引用。

在技术性能层面，报告呈现了若干标志性数据。AI智能体在现实世界计算机任务中的成功率在18个月内从12%跃升至66%，距人类表现仅差6个百分点；网络安全任务的AI解题成功率从2024年的15%飙升至93%；"人类终极考试"基准上顶级模型得分已从2025年的8.8%跃升至50%以上。在中美AI竞争态势方面，报告记录了一个历史性节点：截至2026年3月，美国顶尖模型Claude Opus 4.6的Elo评分为1503，中国顶尖模型紧随其后，差距仅剩2.7%——这是中美AI顶尖模型性能差距首次收缩至个位数以内，标志着全球AI竞争从"单极主导"正式进入"动态博弈"阶段。生成式AI的普及速度同样惊人：短短三年内，全球生成式AI采纳率达到约53%，超越了个人电脑和互联网在同等时间窗口内的扩散速度，美国消费者由此获得的年度消费者剩余估计已达1720亿美元。

然而报告同时揭示了一个系统性矛盾：AI能力全面加速突破的同时，治理体系、评估工具和信息透明度却在持续退步。基础模型透明度指数均值从58分骤降至40分；2025年95个前沿模型中80个未公开训练代码；全球AI安全事故记录从233起增至362起，标准化安全评估机制严重缺位。与此同时，2017年至2026年间，顶级AI学者移居美国的数量下降89%，仅过去一年又跌80%——资本在涌入，但顶尖人才流失正侵蚀美国的长期研发优势。报告主席在序言中写道："AI扩张速度已超出一切围绕它建立的管理体系所能跟上的步伐。"对中国AI治理研究者而言，这一结论在中美两种治理路径下同等适用：能力-治理的结构性落差，是当前全球AI政策讨论中最需要直面的核心命题。

2. 2026世界互联网大会亚太峰会在港开幕，聚焦AI赋能与安全治理

2026年4月13日，以"数智赋能创新发展——携手构建网络空间命运共同体"为主题，为期两天的2026年世界互联网大会亚太峰会在香港会展中心开幕。今年是香港连续第二年承办这一国际会议，来自全球50余个国家和地区的政府部门部长级官员、国际组织高级别代表、驻华使节、互联网领军企业代表以及专家学者等约千名嘉宾参会，规格和参会规模均较上届有所提升。峰会由世界互联网大会主办，香港特别行政区政府承办，香港特区政府创新科技及工业局协办。

本届峰会呈现三大重要升级。其一，主论坛首次设立"世界互联网大会杰出贡献者盛典"，邀请多位国际知名创科翘楚分享其在推动全球互联网发展方面的卓越贡献；其二，峰会首次设立部长级会议，汇聚国内外部长级官员就创科驱动经济发展与国际数字经济合作进行高级别交流；其三，分论坛倍增至六场，围绕"智能体创新与应用""数字金融""人工智能安全治理""智惠民生""数智健康""典籍数智化与传播"等当前最热门的科技与产业议题深入研讨。

在开幕式上，香港特别行政区行政长官李家超表示，峰会举办充分彰显了香港在"一国两制"下的独特优势，香港正全力以负责任和包容共济的方式发挥AI的强大力量，在AI应用准备度方面已位居全球领先经济体之列。世界互联网大会理事长、国家互联网信息办公室主任庄荣文则强调，举办本次峰会旨在顺应数字化、网络化、智能化深入推进的时代大势，以数智领域发展新成果、合作新成效，为共同开创亚太美好数智未来作出贡献。与峰会同期，香港还于4月13日至16日举办"香港国际创科展"（InnoEX），聚焦AI+应用与机器人技术等领域，形成"一加一大于二"的创科盛会效应。本次峰会的召开，进一步强化了香港作为连接中国内地与全球数字经济合作枢纽的战略定位。

3. 中国最大 AI4S 计算集群落地郑州

2026年4月14日，中科曙光提供的6万卡面向AI for Science（AI4S，人工智能驱动科学研究）的计算集群，在位于河南郑州的国家超算互联网核心节点正式建成投用。这是目前国内规模最大的AI4S计算集群，也是全球领先的AI驱动科学创新专用算力平台。中国科学院院士、河南省科学院院长徐红星在发布会上表示："该集群落地不仅是一次技术成果展示，更是我国人工智能技术与科研创新深度融合的里程碑。"

这套6万卡集群的技术含量远超算力规模本身。集群包含6款全部自主可控芯片，其中scaleFabric是国内首款类InfiniBand原生RDMA高速网络，端口速率达400Gb/s，交换延时仅260ns，打破了海外厂商在高端高速网络市场的长期垄断。集群可提供双精度与半精度算力，总HBM容量达3.8PB，HBM总带宽108PB/s，可同时高效支撑传统科学工程计算与AI大模型训练，解决了单一架构无法兼顾的痛点。从2026年2月5日郑州核心节点3万卡上线，到此次6万卡集群落地，中科曙光仅用不到3个月完成了从万卡级工程化突破到超大规模部署的跨越，展示了国产算力在大规模系统工程化部署上的执行速度。伴随集群落地，国家超算互联网平台已构建起国内规模最大的AI4S计算基础设施，总计链接超300万CPU核和超20万GPU卡，接入全国一体化算网调度体系。

在应用成果层面，集群已在生物、材料等多领域完成大规模并行计算并取得多项突破：3万卡规模蛋白质折叠模拟较传统算法加速1000倍；4.5万卡规模实现万亿原子液态水分子动力学模拟，在打破世界模拟规模纪录的同时，效率提升3个数量级；414.7亿原子超大规模模拟、全脑860亿神经元模拟及万亿网格湍流模拟均已完成。AI4S被英伟达列为与大语言模型、具身智能并列的AI三大关键方向之一，远期市场规模有望达到千亿美元级别。此次集群的建成投用，在国产算力全链自主可控和科研范式变革两个维度均具有重要的战略意义，也标志着中国在这一大国科技竞争的关键赛道上正式跻身全球第一梯队。

4. 国务院印发《关于推进服务业扩能提质的意见》，首次明确"支持采购大模型、智能体服务"

2026年4月21日，国务院印发《关于推进服务业扩能提质的意见》（国发〔2026〕7号），提出到2030年服务业总规模迈上100万亿元台阶，培育更多"中国服务"品牌。这是继2025年全国服务业大会后，推动服务业高质量发展的首个系统性顶层政策文件，涵盖五方面二十条具体举措，涉及生产性服务业全链补强、生活性服务业提质、服务业数智化水平提升、支持政策体系完善等核心方向。

在AI政策层面，这份文件的最重要突破是首次在国务院层面明确提出"支持采购大模型、智能体服务"——将AI大模型和Agent产品的政府与市场采购从实践层面正式上升至顶层政策层面。这意味着AI正式从"研发支持对象"切换为"鼓励采购的政策标的"，进入商业化落地的新阶段。文件在信息技术相关部署上亦多有着墨：深入实施"人工智能+"行动，加快智能编程工具研发使用；高质量建设国家人工智能应用中试基地；有序推进算力布局与边缘算力建设，完善智算云服务体系；推动5G-A网络发展，加强6G技术研发等。与此同时，工信部于同日部署"算力银行""算力超市"等创新业务，探索降低中小企业用算门槛，进一步完善了本次政策组合拳的配套支撑体系。

从产业政策演进视角来看，这份文件具有重要的里程碑价值：它标志着中国AI产业发展政策从"鼓励研发投入"阶段，正式进入"推动政府与市场协同采购部署"的新阶段。"支持采购大模型、Agent服务"这一表述一旦系统落地，将直接打开政府部门、公共机构对国内大模型产品的系统性采购通道，对主流大模型厂商的政务端业务具有实质性利好，同时也将加速国内AI应用生态从实验室验证走向规模化商业部署，推动AI从"看得见、摸不着"的技术概念向千行百业可采购、可部署的生产力工具实质性转变。

5. 中国AI大模型周调用量环比降23.8%，美国近两个月来首次反超

2026年4月20日，《每日经济新闻》根据OpenRouter最新数据测算：上一统计周（4月13日至19日）全球AI大模型总调用量为20.6万亿Token，连续两周下滑。其中，上榜中国AI大模型的周调用量下滑至4.441万亿Token，连续两周下滑，较前一周下滑23.77%；美国AI大模型周调用量为4.908万亿Token，环比增长20.62%。这是美国AI大模型周调用量近两个月以来首次超越中国，结束了自2026年2月中旬以来中国模型持续领先的局面。

从具体榜单来看，上周全球调用量排名前九中仍有四款中国模型在列：DeepSeek V3.2排名第二（1.28万亿Token），小米MiMo-V2-Pro排名第四（1.15万亿Token，环比增长90%），MiniMax M2.5、M2.7分列第六、第七位。值得注意的是，此前连续多周领跑的阿里Qwen3.6 Plus在前一周（4月6日至12日）以1.66万亿Token位居榜首后，当周即骤降跌出前十，此前多次上榜的Kimi K2.5、智谱GLM系列等模型则已连续三周未登榜。美国端的反超主要由Anthropic旗下Claude系列拉动：Claude Sonnet 4.6当周冲上榜首，周调用量达1.38万亿Token；Claude Opus 4.6位居第三，达1.22万亿Token；两款模型合计占美国AI大模型周调用量逾五成。

上海财经大学特聘教授胡延平分析指出，此轮中国模型调用量下滑的核心驱动是算力涨价传导：国内外云厂商集体涨价后，用户不得不主动控制调用总量以节约成本，而当价格优势不再突出，模型产品力便成为左右用户选择的关键。他同时提醒，OpenRouter的Token调用量仅占全球消耗总量约2%至4%，其排名波动更多反映开源和新发模型的竞争态势，不能代表整体市场走向。从更长时间维度看，中国模型在OpenRouter上近两个月的持续领先，已足以证明国产大模型在开发者生态中的真实影响力；此次短暂的美国反超，更应被理解为价格重塑用户行为的一次信号性修正，而非结构性逆转。

6. Anthropic 发布 Claude Opus 4.7：编程能力登顶全球，视觉推理率达 98.5%

2026年4月16日，Anthropic正式发布旗舰模型Claude Opus 4.7，这是Opus 4.6发布约两个月后的直接升级版，也是继Claude Mythos Preview（仅向约40家机构限量开放）之后，Anthropic面向所有用户正式开放的当前最强公开可用模型。定价与Opus 4.6保持一致：API输入5美元/百万Token，输出25美元/百万Token。本次升级聚焦三大方向：软件工程能力跃升、视觉推理能力重建、以及配套工具链的系统强化。

在编程能力层面，SWE-bench Pro（覆盖四种编程语言完整工程流水线的权威基准）得分从Opus 4.6的53.4%跃升至64.3%，提升约11个百分点，超越GPT-5.4的57.7%和Gemini 3.1 Pro的54.2%，成为目前公开可用模型中的最高分；SWE-bench Verified从80.8%升至87.6%，同样位居公开模型首位；CursorBench（真实IDE场景编程辅助基准）从58%跳升至70%。在视觉能力层面，Opus 4.7实现了质变级突破：最大图像分辨率从约1.15MP提升至3.75MP（原来的3.3倍），视觉坐标现与实际像素1:1对应；安全测试工具XBOW的视觉识别准确率从54.5%飙升至98.5%，XBOW CEO表示"我们最大的痛点直接消失了，这解锁了一整类此前完全无法使用的场景"。此外，Opus 4.7在法律基准Harvey BigLaw Bench上达到90.9%，在Financial Agent上达到0.813，均刷新了公开模型纪录。

在配套功能层面，Opus 4.7新增了三项重要更新：在high与max之间新增xhigh推理等级，支持更精细控制推理深度与响应延迟；Claude Platform API新增Task Budgets公测功能，允许开发者为长任务设定Token消耗预算；Claude Code新增/ultrareview代码审查命令，可自动标记出专业审查者会发现的缺陷与设计问题。值得注意的是，Opus 4.7采用了新版分词器，相同内容可能产生原来1.0至1.35倍的Token消耗，在代码密集场景下影响更为明显，建议开发者在正式切换前对成本进行评估。在Anthropic的产品战略框架中，Opus 4.7处于一个特殊位置：它是第一个搭载针对网络安全场景新防护机制的正式发布模型，也是在Mythos Preview验证最终安全护栏之前、Anthropic向大众开放的能力上限——一次技术能力与安全合规之间精心设计的工程平衡。

7. Anthropic 官方正式推出身份验证功能：不支持中国大陆证件，中国用户无法完成核验

2026年4月14日，Anthropic官方帮助中心更新了《Claude身份验证》公告，正式宣布在claude.ai平台上推出身份验证机制。根据官方说明，当用户尝试访问特定高级功能（如订阅Claude Max最高档会员）、触发平台例行完整性检查，或系统判定存在安全合规需要时，将弹出身份验证提示。整个验证流程由美国第三方KYC服务商Persona Identities提供，用户须提交政府签发的实体带照片证件（护照、驾照或国家身份证，复印件、截图、电子证件均不接受），并配合实时自拍人脸比对，全程约5分钟，Anthropic承诺不在系统中留存任何证件图像。

然而，这一机制对中国大陆用户而言，构成了实质性的访问障碍。Anthropic的服务条款已明确将中国大陆列为"不支持地区"，意味着即便用户通过Persona的证件核验，一旦平台识别到其账号来自不支持地区，官方FAQ明确指出账号"照样可能被禁用"——原因包括"从不支持的位置创建账户""违反服务条款"等。这一机制在逻辑上形成了一个悖论：使用中国护照或身份证进行验证，等同于主动向平台证明账号创建于不支持地区，反而加大封号风险；而不进行验证，则无法访问需要核验的高级功能。

从更宏观的背景来看，这是Anthropic在商业合规层面对中国大陆用户的第三次系统性收紧：2025年9月，Anthropic禁止中国资本控股超50%的实体使用Claude；2026年4月4日，切断Claude订阅对OpenClaw等第三方工具的覆盖；此次推出KYC身份验证，则将此前相对模糊的"软封禁"状态，升级为更具操作性的"硬阻断"机制。业内人士分析认为，其背后是美国出口管制政策压力、平台规模化后的合规风险管理、以及商业上向更高价值企业客户集中的多重驱动。对国内大量依赖Claude Code、Claude API进行开发工作的个人开发者和企业而言，这一政策变化意味着原本通过各种方式维系的访问路径面临系统性收窄，加速向国内替代方案迁移的压力进一步上升。

周报编辑｜徐赫泽

审核｜赵杨博

终审｜梁正王净宇

内容中包含的图片若涉及版权问题，请及时与我们联系删除

【AI治理周报·4月第3期】斯坦福报告称中美AI差距缩至2.7%，中国最大AI4S计算集群落地郑州

评论列表

评论