
DeepSeek 正式推出其最新的实验性模型 DeepSeek-V3.2-Exp。这是一个实验性(Experimental)的版本,该版本在 V3.1-Terminus 的基础上,引入了革命性的 DeepSeek Sparse Attention(DSA) 技术,旨在大幅提升长文本处理的效率。
目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。
与此同时,官方宣布 API 服务价格下调超过 50%。
核心亮点一览:
技术革新:首创 DeepSeek 稀疏注意力(DSA) 机制,在几乎不影响模型性能的前提下,显著提升了长文本的训练和推理速度。
成本骤降:得益于效率提升,API 调用成本直降超过 50%。
无缝升级与对比测试:官方 App、网页端等平台已全面升级。同时为方便用户对比,限时保留了旧版 V3.1 模型的 API 接口,并同样享受新版价格。
以下内容要点来自官方文章。
超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

最新、最值得关注的 AI 新品资讯;
不定期赠送热门新品的邀请码、会员码;
最精准的AI产品曝光渠道
01
DeepSeek Sparse Attention(DSA)
DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
论文也已同步公开:
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
官方注:在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。在最后阶段,以 TileLang 作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含 TileLang 与 CUDA 两种版本。我们建议社区在进行研究性实验时,使用基于 TileLang 的版本以方便调试和快速迭代。
02
API 价格大幅下调
模型服务成本的降低,最直接的受益者就是开发者。DeepSeek 宣布,API 定价即刻生效新标准,整体降幅超过 50%。这意味着开发者能够以更低的成本,构建更强大的应用。

目前,所有官方平台(App、网页端、小程序)和标准 API 接口均已默认使用 V3.2-Exp 模型。
03
DS-V3.1 限时保留
作为实验性版本,V3.2-Exp 虽然在评测中表现优异,但仍需在真实应用场景中接受更广泛的检验。为此,DeepSeek 诚挚邀请所有用户参与测试,并提供宝贵的反馈。
为了方便您进行新旧版本对比,官方限时保留了 V3.1 模型的API访问通道(至 2025 年 10 月 15 日),且调用价格与新版 V3.2-Exp 相同。
用户只需修改 base_url="https://api.deepseek.com/v3.1_terminus_expires_on_20251015" 即可访问 V3.1-Terminus,调用价格与 V3.2-Exp 相同。
更详细的使用方法请参考官方文档:
https://api-docs.deepseek.com/zh-cn/guides/comparison_testing。
反馈链接:
https://feedback.deepseek.com/dsa

18 年 SEO 增长经验专家:别再收藏各种 AEO 最佳攻略了,自己动手实验才是做好的关键
Nano Banana 核心团队:图像生成质量几乎到顶了,下一步是让模型读懂用户的intention
转载原创文章请添加微信:founderparker
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢