DeepSeek V3.2 评测详情
DeepSeek V3.2 当前已收录的代表性评测结果包括 LiveCodeBench(19 / 118,得分 83.30)、AIME2025(30 / 106,得分 93.10)、GPQA Diamond(61 / 175,得分 82.40)。
评测结果
DeepSeek V3.2
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 5 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 3 项评测评测名称 / 模式
得分
排名/总数