Claude Sonnet 4 支持百万上下文了，AI Coding 的想象力更大了

文章转载自「AI寒武纪」。今天，Anthropic 宣布 Claude Sonnet 4 支持高达 100 万 Token 的上下文窗口，容量是之前的 5 倍，开发者在单次请求中就能处理整个大型代码库（超过 75,000 行代码）或数十篇研究论文。

Sonnet 4 的长上下文支持目前已在 Anthropic API 上向 Tier 4 和拥有自定义速率限制的客户开放公测，并将在未来几周内向更广泛的用户推出。

详细信息：https://docs.anthropic.com/en/docs/build-with-claude/context-windows#1m-token-context-window

目前，Sonnet 4 的长上下文功能已在亚马逊 Bedrock 上作为公开测试版（public beta）提供，此外，该功能也即将登陆 Google Cloud 的 Vertex AI 平台。

超 10000 人的「AI 产品市集」社群！不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者，飞书扫码加群：

进群后，你有机会得到：

最新、最值得关注的 AI 新品资讯；
不定期赠送热门新品的邀请码、会员码；
最精准的AI产品曝光渠道

01 用例

100 万 Token 的上下文窗口意味着 Claude 能够处理和理解前所未有的信息量，从而支持更全面、数据更密集的复杂任务。开发者现在可以利用 Claude 实现以下高级用例：

大规模代码分析： 将包含源文件、测试和文档的完整代码库一次性加载给 Claude。模型能够深入理解项目架构，识别跨文件的依赖关系，并为整个系统的设计提出优化建议。

海量文档合成： 处理如法律合同、学术研究论文集或技术规范等大量文档。Claude 可以在保持完整上下文的情况下，分析数百份文档之间的复杂关系。

上下文感知智能体（Agent）： 构建能够在数百次工具调用和多步骤工作流中保持上下文的智能体。开发者可以向其提供完整的 API 文档、工具定义和交互历史，而无需担心模型遗忘关键信息，从而保证了智能体行为的连贯性。

02 全新定价模型与成本优化方案

为了应对处理超长上下文所需增加的计算资源，Anthropic 为超过 200K Token 的提示（prompt）调整了定价。具体的定价结构如下：

提示长度	输入价格 (每百万Token)	输出价格 (每百万Token)
≤ 200K Tokens	$3	$15
> 200K Tokens	$6	$22.50

Anthropic 同时指出，开发者可以通过结合使用提示缓存（prompt caching）来降低长上下文应用的延迟和成本。此外，利用批处理（batch processing）功能处理 100 万 Token 上下文的任务，还可额外节省 50%的成本。

价格：https://www.anthropic.com/pricing#api

03 早期用户好评如潮：

解锁生产级 AI 工程

此次更新已获得早期合作伙伴的高度评价：金杯银杯不如用户的口碑。

Bolt.new，一家将 Claude 集成到其浏览器开发平台的公司，其联合创始人兼 CEO Eric Simons 表示：“Claude Sonnet 4 一直是他们代码生成工作流的首选模型，其性能在生产环境中持续优于其他领先模型。现在有了 100 万 Token 的上下文窗口，开发者可以在处理真实世界的大型项目时，依然保持所需的高准确性。

iGent AI，一家总部位于伦敦、专注于将对话转化为可执行代码的软件开发公司，其联合创始人兼 CEO Sean Ward 也分享：曾经的不可能，如今已成现实。拥有 100 万 Token 上下文的 Claude Sonnet 4 极大地增强了软件工程智能体 Maestro 的自主能力。这一飞跃解锁了真正的生产级工程——能够在真实世界的代码库上进行持续数天的开发会话，从而在智能体软件工程领域建立了一个新的范式。

参考：https://www.anthropic.com/news/1m-context