IC SWE-Lancer(Diamond)

更新于 2026年4月3日·888 次浏览

问题数量: 237
发布机构: OpenAI
评测类别: 编程与软件工程
评测指标: Pass @K
支持语言: 英文
难度等级: 高难度

简介

OpenAI开源的评测大模型解决独立软件工程任务能力的评测基准

相关资源

IC SWE-Lancer(Diamond)评测最新大模型排名与完整榜单数据

查看 IC SWE-Lancer(Diamond) 的最新得分、模型模式、发布时间与参数规模，快速了解当前完整榜单表现。

数据来源：DataLearnerAI

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型模式说明

许可证:

来源:

模型发布时间截止:

排名	模型				开源情况
	GPT-5.3 Codex 常规模式	81.40	2026-02-05	未知	闭源
	GPT-5.2 思考水平 · 极高工具	74.60	2025-12-11	未知	闭源
	GPT-5.1 开启思考	69.70	2025-11-12	未知	闭源
4	GPT-4.1 mini 常规模式	33.00	2025-04-14	未知	闭源
5	GPT-4.5 常规模式	32.60	2025-02-28	未知	闭源
6	GPT-4o 常规模式	23.30	2024-05-13	未知	闭源
7	GPT-4.1 nano 常规模式	15.30	2025-04-14	未知	闭源
8	GPT-4.1 常规模式	14.40	2025-04-14	未知	闭源