OpenAI o3 评测详情
OpenAI o3 当前已收录的代表性评测结果包括 Creative Writing(2 / 23,得分 87.65)、MATH-500(5 / 44,得分 98.10)、Aider-Polyglot(3 / 26,得分 81.30)。
评测结果
OpenAI o3
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 8 项评测评测名称 / 模式
得分
排名/总数
OpenAI o3 当前已收录的代表性评测结果包括 Creative Writing(2 / 23,得分 87.65)、MATH-500(5 / 44,得分 98.10)、Aider-Polyglot(3 / 26,得分 81.30)。