GPT-4.1 评测详情
GPT-4.1 当前已收录的代表性评测结果包括 MMLU(9 / 65,得分 90.20)、GSM8K(5 / 26,得分 95.90)、MMLU Pro(55 / 124,得分 80.50)。
评测结果
GPT-4.1
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 6 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 4 项评测评测名称 / 模式
得分
排名/总数
GPT-4.1 当前已收录的代表性评测结果包括 MMLU(9 / 65,得分 90.20)、GSM8K(5 / 26,得分 95.90)、MMLU Pro(55 / 124,得分 80.50)。