DeepSeek-V3.1 发布，官方划重点：Agent、Agent、Agent！

DEEPSEEK

V3.1 正式发布

2025年08月21日
北京

混合推理架构
思考/非思考模式合一

更高思考效率
更少 Token，更快响应

更强 Agent 能力
工具使用与智能体任务提升

MODEL UPDATES

核心架构与使用

混合推理架构: 单一模型支持思考与非思考双模式。
网页端/App: 已同步升级，通过“深度思考”按钮自由切换。
API 升级: 上下文扩展至 128K。
• deepseek-chat 对应非思考模式。
• deepseek-reasoner 对应思考模式。

AGENT BOOST

智能体能力增强

通过 Post-Training 优化，工具使用与智能体任务表现大幅提升。
编程智能体: 在代码修复 (SWE) 和命令行终端 (Terminal-Bench) 评测中，相比旧版模型有明显提高。

搜索智能体: 在复杂搜索 (browsecomp) 和多学科难题 (HLE) 测试上，性能大幅领先 R1-0528。

EFFICIENCY UP

思考与输出效率

思考模式 (V3.1-Think): 经思维链压缩训练，输出 token 数减少 20%-50%，而性能与 R1-0528 持平 (如 AIME, GPQA 等评测)。
非思考模式: 相比 V3-0324，输出长度显著减少，同时保持同等模型性能。

API & FRAMEWORK

API 新特性

Strict Mode FC: Beta 接口支持严格模式的 Function Calling，确保输出严格满足 Schema 定义。
Anthropic API 兼容: 增加对 Anthropic API 格式的支持，可轻松将 V3.1 能力接入 Claude Code 等框架。

OPEN SOURCE

模型开源与技术要点

训练增量: V3.1 Base 模型在 V3 基础上额外训练了 840B tokens。
开源模型: Base 模型与后训练模型均已在 Huggingface 和魔搭开源。
注意: 使用 UE8M0 FP8 Scale 参数精度；分词器及 chat template 与 V3 存在较大差异，部署需详读新文档。

PRICING ADJUST

价格调整通知

生效时间: 北京时间 2025年9月6日凌晨起。
调整内容:
1. 执行新版价格表。
2. 取消夜间时段优惠。
过渡期: 在 9月6日前，仍按原价格政策计费。API 服务资源已扩容。

Hugging Face
huggingface.co/deepseek-ai

魔搭 (ModelScope)
modelscope.cn/organization/deepseek-ai

内容中包含的图片若涉及版权问题，请及时与我们联系删除

DeepSeek-V3.1 发布，官方划重点：Agent、Agent、Agent！

评论列表

评论