GPT-4 当前已收录的代表性评测结果包括 MMLU(31 / 65,得分 86.40)、HumanEval(27 / 39,得分 67)、DROP(7 / 9,得分 80.90)。并附有 1 个数据来源链接供参考。