GPT-4.1 nano 评测详情
GPT-4.1 nano 当前已收录的代表性评测结果包括 MMLU(50 / 65,得分 80.10)、GPQA Diamond(150 / 175,得分 50.30)、FrontierMath(52 / 60,得分 1)。
评测结果
GPT-4.1 nano
GPT-4.1 nano 当前已收录的代表性评测结果包括 MMLU(50 / 65,得分 80.10)、GPQA Diamond(150 / 175,得分 50.30)、FrontierMath(52 / 60,得分 1)。