OpenAI o4 - mini 评测详情
OpenAI o4 - mini 当前已收录的代表性评测结果包括 AIME 2024(1 / 62,得分 98.70)、MMLU(2 / 65,得分 93)、AIME2025(10 / 106,得分 99.50)。
评测结果
OpenAI o4 - mini
评测结果
综合评估
共 6 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 12 项评测评测名称 / 模式
得分
排名/总数
Agent能力评测
共 3 项评测评测名称 / 模式
得分
排名/总数