GLM-4.6 评测详情
GLM-4.6 当前已收录的代表性评测结果包括 LiveCodeBench(16 / 118,得分 84.50)、AIME2025(15 / 106,得分 98.60)、MMLU Pro(41 / 124,得分 83)。
评测结果
GLM-4.6
评测结果
综合评估
共 6 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 3 项评测评测名称 / 模式
得分
排名/总数
GLM-4.6 当前已收录的代表性评测结果包括 LiveCodeBench(16 / 118,得分 84.50)、AIME2025(15 / 106,得分 98.60)、MMLU Pro(41 / 124,得分 83)。