DeepSeek-V3.2-Exp
DeepSeek-V3.2-Exp 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2025-09-29,定位为 推理大模型,参数规模约为 6710.0B,上下文长度为 128K,模型文件大小约 1342GB,采用 MIT License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.28 | $0.42 |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | $0.028 | -- |
DeepSeek V3.2-Exp 当前已收录的代表性评测结果包括 SimpleQA(1 / 45,得分 97.10)、MMLU Pro(17 / 116,得分 85)、Aider-Polyglot(7 / 26,得分 74.50)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
DeepSeek-V3.2-Exp 是 DeepSeek 在 2025-09-29 发布的 v3.2 实验版子型号,基于 V3.1-Terminus 持续训练并首次引入 DeepSeek Sparse Attention (DSA),旨在提升长上下文训练与推理效率,同时维持与 V3.1-Terminus 相当的输出质量。该模型已在 App、Web 与 API 同步上线,且 API 定价整体下调 50%+。
来源:发布新闻;Models & Pricing;Hugging Face 模型页。
官方公开信息显示,V3.2-Exp 在公开基准上的表现整体与 V3.1-Terminus 持平(用于验证 DSA 引入对质量的影响有限)。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
