OpenAI o3-mini (medium) 评测详情
OpenAI o3-mini (medium) 当前已收录的代表性评测结果包括 LiveCodeBench(53 / 118,得分 67.40)、FrontierMath(32 / 60,得分 8.10)。
评测结果
OpenAI o3-mini (medium)
OpenAI o3-mini (medium) 当前已收录的代表性评测结果包括 LiveCodeBench(53 / 118,得分 67.40)、FrontierMath(32 / 60,得分 8.10)。