复杂问题推理能力大幅提升，DeepSeekAI发布DeepSeek V3.2正式版本以及一个评测结果可以媲美Gemini 3.0 Pro的将开源模型推到极限性能的DeepSeek-V3.2-Speciale模型

几个小时前，DeepSeek 突然发布了两款全新的推理模型：DeepSeek V3.2 正式版与DeepSeek V3.2-Speciale。前者已经全面替换官方网页、App 与 API 成为新的默认模型；后者则以“临时研究 API”的方式开放，被定位为极限推理版本。

这次发布吸引了社区立刻刷屏，不仅因为又多了两个新型号，更因为它们分别代表了开源模型两个截然不同的方向：一个负责日常生产，一个负责探索推理边界。

两个月前，DeepSeek 把 DeepSeek V3.2-Exp 推到线上，明确标注“实验版”。验证他们提出的DSA的效果。

DSA全称为DeepSeek Sparse Attention：

DSA 让模型不必再对长达数十万 Token 的上下文“全部计算注意力”，而是先预测哪些内容重要，再对这些内容做精细计算。

换成更直观的比喻：传统注意力像学生复习时把所有资料都从头读到尾，累、慢、效率低。DSA 像有个“索引助手”，先快速浏览所有资料，再告诉你：“最关键的就这 5%”。模型随后只对这些内容精算注意力。因此 DSA 的直接效果是：

长上下文成本下降（越长越明显）
推理速度提升
稳定性更强，思考链不容易被上下文噪声干扰

这套机制在 DeepSeek V3.2-Exp 上首次大规模实战，官方希望确认：在不大幅动模型主体的前提下，把 DSA 这套稀疏注意力接到原有框架里，看看在真实用户的长对话、复杂推理和 Agent 使用中会不会翻车。结果比很多人预期得更乐观——大量社区对比测试显示，在多数场景中，DeepSeek V3.2-Exp 并不逊于DeepSeek V3.1-Terminus，没有出现明显的“减分场景”，却带来了更好的长上下文效率。这等于给 DSA 交上了一份“生产可用”的答卷。

今天上线的 DeepSeek V3.2 正式版，就是在这套架构验证之上，完成的一次「真正意义上的完整模型」。同时亮相的，则把推理能力进一步推到竞赛级金牌的高度。一个主打“日用 + Agent”，一个主打“极限推理 + 思考深度”，共同勾勒出 DeepSeek 在新一代推理模型上的完整布局。

复杂问题推理能力大幅提升，DeepSeekAI发布DeepSeek V3.2正式版本以及一个评测结果可以媲美Gemini 3.0 Pro的将开源模型推到极限性能的DeepSeek-V3.2-Speciale模型

DataLearner 官方微信

一、先说清楚：DeepSeek V3.2 正式版和 DeepSeek V3.2-Exp 到底有什么不一样？

二、DeepSeek V3.2：推理、输出长度和 Agent 的“三角平衡”

DeepSeek V3.2也开始有了交替思考的能力

三、DeepSeek V3.2-Speciale：把推理能力开到“竞赛金牌”的档位

四、对开发者来说，DeepSeek V3.2 这一代应该怎么用？

热门博客