文章转载自「AI寒武纪」。今天,Anthropic 宣布 Claude Sonnet 4 支持高达 100 万 Token 的上下文窗口,容量是之前的 5 倍,开发者在单次请求中就能处理整个大型代码库(超过 75,000 行代码)或数十篇研究论文。

Sonnet 4 的长上下文支持目前已在 Anthropic API 上向 Tier 4 和拥有自定义速率限制的客户开放公测,并将在未来几周内向更广泛的用户推出。

详细信息:https://docs.anthropic.com/en/docs/build-with-claude/context-windows#1m-token-context-window

目前,Sonnet 4 的长上下文功能已在亚马逊 Bedrock 上作为公开测试版(public beta)提供,此外,该功能也即将登陆 Google Cloud 的 Vertex AI 平台。


超 10000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
图片
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

用例

100 万 Token 的上下文窗口意味着 Claude 能够处理和理解前所未有的信息量,从而支持更全面、数据更密集的复杂任务。开发者现在可以利用 Claude 实现以下高级用例:

大规模代码分析: 将包含源文件、测试和文档的完整代码库一次性加载给 Claude。模型能够深入理解项目架构,识别跨文件的依赖关系,并为整个系统的设计提出优化建议。

海量文档合成: 处理如法律合同、学术研究论文集或技术规范等大量文档。Claude 可以在保持完整上下文的情况下,分析数百份文档之间的复杂关系。

上下文感知智能体(Agent): 构建能够在数百次工具调用和多步骤工作流中保持上下文的智能体。开发者可以向其提供完整的 API 文档、工具定义和交互历史,而无需担心模型遗忘关键信息,从而保证了智能体行为的连贯性。


02 

全新定价模型与成本优化方案

为了应对处理超长上下文所需增加的计算资源,Anthropic 为超过 200K Token 的提示(prompt)调整了定价。具体的定价结构如下:

提示长度
输入价格
 (每百万Token)
输出价格
 (每百万Token)
≤ 200K Tokens
$3
$15
> 200K Tokens
$6
$22.50

Anthropic 同时指出,开发者可以通过结合使用提示缓存(prompt caching)来降低长上下文应用的延迟和成本。此外,利用批处理(batch processing)功能处理 100 万 Token 上下文的任务,还可额外节省 50%的成本。

价格:https://www.anthropic.com/pricing#api


03 

早期用户好评如潮:

解锁生产级 AI 工程

此次更新已获得早期合作伙伴的高度评价:金杯银杯不如用户的口碑。

Bolt.new,一家将 Claude 集成到其浏览器开发平台的公司,其联合创始人兼 CEO Eric Simons 表示:“Claude Sonnet 4 一直是他们代码生成工作流的首选模型,其性能在生产环境中持续优于其他领先模型。现在有了 100 万 Token 的上下文窗口,开发者可以在处理真实世界的大型项目时,依然保持所需的高准确性。

iGent AI,一家总部位于伦敦、专注于将对话转化为可执行代码的软件开发公司,其联合创始人兼 CEO Sean Ward 也分享:曾经的不可能,如今已成现实。拥有 100 万 Token 上下文的 Claude Sonnet 4 极大地增强了软件工程智能体 Maestro 的自主能力。这一飞跃解锁了真正的生产级工程——能够在真实世界的代码库上进行持续数天的开发会话,从而在智能体软件工程领域建立了一个新的范式。

参考:https://www.anthropic.com/news/1m-context

图片


更多阅读

跟华人创业者聊日本市场,在日本创业有哪些机会?

一个半月高强度 Claude Code :Vibe coding 是一种全新的思维模式

Product Hunt CEO 拆解 PH 打榜:Launch 不是一次性的事

GPT-5 终于发布:别慌、AGI 还没来,第一手的上手体验在这里

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除