DeepSeek-V3.1 Terminus 评测详情
DeepSeek-V3.1 Terminus 当前已收录的代表性评测结果包括 SimpleQA(2 / 45,得分 96.80)、MMLU Pro(23 / 124,得分 85)、Aider-Polyglot(6 / 26,得分 76.10)。
评测结果
DeepSeek-V3.1 Terminus
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
DeepSeek-V3.1 Terminus 当前已收录的代表性评测结果包括 SimpleQA(2 / 45,得分 96.80)、MMLU Pro(23 / 124,得分 85)、Aider-Polyglot(6 / 26,得分 76.10)。