北京
思考/非思考模式合一
更少 Token,更快响应
工具使用与智能体任务提升
网页端/App: 已同步升级,通过“深度思考”按钮自由切换。
API 升级: 上下文扩展至 128K。
•
deepseek-chat
对应非思考模式。•
deepseek-reasoner
对应思考模式。编程智能体: 在代码修复 (SWE) 和命令行终端 (Terminal-Bench) 评测中,相比旧版模型有明显提高。


非思考模式: 相比 V3-0324,输出长度显著减少,同时保持同等模型性能。

Anthropic API 兼容: 增加对 Anthropic API 格式的支持,可轻松将 V3.1 能力接入 Claude Code 等框架。
开源模型: Base 模型与后训练模型均已在 Huggingface 和魔搭开源。
注意: 使用 UE8M0 FP8 Scale 参数精度;分词器及 chat template 与 V3 存在较大差异,部署需详读新文档。
调整内容:
1. 执行新版价格表。
2. 取消夜间时段优惠。
过渡期: 在 9月6日前,仍按原价格政策计费。API 服务资源已扩容。

huggingface.co/deepseek-ai
modelscope.cn/organization/deepseek-ai
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢