Gemini 2.5 Deep Think 评测详情
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(8 / 118,得分 87.60)、AIME2025(11 / 106,得分 99.20)、FrontierMath(12 / 60,得分 29)。
评测结果
Gemini 2.5 Deep Think
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(8 / 118,得分 87.60)、AIME2025(11 / 106,得分 99.20)、FrontierMath(12 / 60,得分 29)。