GLM-4.7 评测详情
GLM-4.7 当前已收录的代表性评测结果包括 LiveCodeBench(15 / 118,得分 84.90)、τ²-Bench(6 / 40,得分 87.40)、AIME2025(23 / 106,得分 95.70)。
评测结果
GLM-4.7
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 3 项评测评测名称 / 模式
得分
排名/总数
Agent能力评测
共 3 项评测评测名称 / 模式
得分
排名/总数
GLM-4.7 当前已收录的代表性评测结果包括 LiveCodeBench(15 / 118,得分 84.90)、τ²-Bench(6 / 40,得分 87.40)、AIME2025(23 / 106,得分 95.70)。