OpenAI o1-mini 评测详情
OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(57 / 124,得分 80.30)、MMLU(40 / 65,得分 85.20)。
评测结果
OpenAI o1-mini
OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(57 / 124,得分 80.30)、MMLU(40 / 65,得分 85.20)。