DEEPSEEK

V3.1 正式发布
2025年08月21日
北京
混合推理架构
思考/非思考模式合一
更高思考效率
更少 Token,更快响应
更强 Agent 能力
工具使用与智能体任务提升
MODEL UPDATES
核心架构与使用
混合推理架构: 单一模型支持思考与非思考双模式。
网页端/App: 已同步升级,通过“深度思考”按钮自由切换。
API 升级: 上下文扩展至 128K。
                         • deepseek-chat 对应非思考模式。
                         • deepseek-reasoner 对应思考模式。
AGENT BOOST
智能体能力增强
通过 Post-Training 优化,工具使用与智能体任务表现大幅提升。
编程智能体: 在代码修复 (SWE) 和命令行终端 (Terminal-Bench) 评测中,相比旧版模型有明显提高。
图片
搜索智能体: 在复杂搜索 (browsecomp) 和多学科难题 (HLE) 测试上,性能大幅领先 R1-0528。
图片
EFFICIENCY UP
思考与输出效率
思考模式 (V3.1-Think): 经思维链压缩训练,输出 token 数减少 20%-50%,而性能与 R1-0528 持平 (如 AIME, GPQA 等评测)。
非思考模式: 相比 V3-0324,输出长度显著减少,同时保持同等模型性能。
图片
API & FRAMEWORK
API 新特性
Strict Mode FC: Beta 接口支持严格模式的 Function Calling,确保输出严格满足 Schema 定义。
Anthropic API 兼容: 增加对 Anthropic API 格式的支持,可轻松将 V3.1 能力接入 Claude Code 等框架。
OPEN SOURCE
模型开源与技术要点
训练增量: V3.1 Base 模型在 V3 基础上额外训练了 840B tokens。
开源模型: Base 模型与后训练模型均已在 Huggingface 和魔搭开源。
注意: 使用 UE8M0 FP8 Scale 参数精度;分词器及 chat template 与 V3 存在较大差异,部署需详读新文档。
PRICING ADJUST
价格调整通知
生效时间: 北京时间 2025年9月6日凌晨起。
调整内容:
1. 执行新版价格表。                        
2. 取消夜间时段优惠。
过渡期: 在 9月6日前,仍按原价格政策计费。API 服务资源已扩容。
图片
Hugging Face
huggingface.co/deepseek-ai
魔搭 (ModelScope)
modelscope.cn/organization/deepseek-ai

内容中包含的图片若涉及版权问题,请及时与我们联系删除