DeepSeek-V4-Flash 评测详情
DeepSeek-V4-Flash 当前已收录的代表性评测结果包括 LiveCodeBench(4 / 118,得分 91.60)、MMLU Pro(13 / 124,得分 86.40)、IMO-AnswerBench(2 / 17,得分 88.40)。
评测结果
DeepSeek-V4-Flash
评测结果
综合评估
共 11 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 14 项评测评测名称 / 模式
得分
排名/总数
AI Agent - 工具使用
共 3 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 3 项评测评测名称 / 模式
得分
排名/总数