IMO 2025
在衡量大语言模型(LLM)智能水平的众多方法中,除了常见的常识推理、专业领域测评外,还有一个正在兴起且极具挑战性的方向——算法问题求解。在这一领域,几乎没有哪项比赛能比 国际信息学奥林匹克(International Olympiad in Informatics,简称 IOI) 更具权威性与含金量。
更新于 2026年4月19日·975 次浏览
- 问题数量
- 6
- 发布机构
- 个人
- 评测类别
- 数学推理
- 评测指标
- Accuracy
- 支持语言
- 英文
- 难度等级
- 高难度
简介
2025年国际奥林匹克信息竞赛
IMO 2025评测最新大模型排名与完整榜单数据
查看 IMO 2025 的最新得分、模型模式、发布时间与参数规模,快速了解当前完整榜单表现。
数据来源:DataLearnerAI
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型模式说明
IMO 2025 排名
| 排名 | 模型 | 开源情况 | |||
|---|---|---|---|---|---|
Grok 4 开启思考 | 29.20 | 2025-07-10 | 未知 | 闭源 | |
![]() GPT-5 开启思考 | 29.00 | 2025-08-07 | 未知 | 闭源 | |
![]() Gemini 2.5-Pro 开启思考 | 15.20 | 2025-06-05 | 未知 | 闭源 | |
4 | ![]() Opus 4.1 常规模式 | 11.70 | 2025-08-06 | 未知 | 闭源 |
5 | ![]() Claude Sonnet 4 开启思考 | 4.00 | 2025-05-23 | 未知 | 闭源 |
6 | ![]() Claude Sonnet 4 常规模式 | 3.30 | 2025-05-23 | 未知 | 闭源 |
7 | ![]() OpenAI o4 - mini 开启思考 | 3.00 | 2025-04-16 | 未知 | 闭源 |
8 | ![]() Kimi K2 常规模式 | 2.00 | 2025-07-11 | 10000亿 | 免费商用 |
9 | ![]() DeepSeek-V3-0324 常规模式 | 1.70 | 2025-03-24 | 6710亿 | 免费商用 |




