DeepSeek-V3 评测详情
DeepSeek-V3 当前已收录的代表性评测结果包括 BBH(3 / 20,得分 92.30)、MATH(7 / 42,得分 87.80)、HumanEval(9 / 39,得分 89)。
评测结果
DeepSeek-V3
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 4 项评测评测名称 / 模式
得分
排名/总数
DeepSeek-V3 当前已收录的代表性评测结果包括 BBH(3 / 20,得分 92.30)、MATH(7 / 42,得分 87.80)、HumanEval(9 / 39,得分 89)。