DeepSeek-R1-0528 评测详情
DeepSeek-R1-0528 当前已收录的代表性评测结果包括 MATH-500(7 / 44,得分 98)、Creative Writing(4 / 23,得分 86.25)、MMLU Pro(23 / 124,得分 85)。
评测结果
DeepSeek-R1-0528
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 5 项评测评测名称 / 模式
得分
排名/总数
DeepSeek-R1-0528 当前已收录的代表性评测结果包括 MATH-500(7 / 44,得分 98)、Creative Writing(4 / 23,得分 86.25)、MMLU Pro(23 / 124,得分 85)。