DeepSeek-R1 评测详情
DeepSeek-R1 当前已收录的代表性评测结果包括 MMLU(8 / 65,得分 90.80)、MMLU Pro(35 / 124,得分 84)、MATH-500(13 / 44,得分 97.30)。
评测结果
DeepSeek-R1
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
DeepSeek-R1 当前已收录的代表性评测结果包括 MMLU(8 / 65,得分 90.80)、MMLU Pro(35 / 124,得分 84)、MATH-500(13 / 44,得分 97.30)。