DeepSeek V3.2-Exp 评测详情
DeepSeek V3.2-Exp 当前已收录的代表性评测结果包括 SimpleQA(1 / 45,得分 97.10)、MMLU Pro(23 / 124,得分 85)、Aider-Polyglot(7 / 26,得分 74.50)。
评测结果
DeepSeek V3.2-Exp
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
Agent能力评测
共 3 项评测评测名称 / 模式
得分
排名/总数
DeepSeek V3.2-Exp 当前已收录的代表性评测结果包括 SimpleQA(1 / 45,得分 97.10)、MMLU Pro(23 / 124,得分 85)、Aider-Polyglot(7 / 26,得分 74.50)。