大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜，涵盖 SWE-Bench Verified、SWE-Bench Pro、LiveCodeBench、SWE-bench Multilingual 等数据集，对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

数据更新于 2026-04-28 13:02:03

截至 2026年4月，本页覆盖 SWE-bench Verified, LiveCodeBench, SWE-Bench Pro - Public, SWE-bench Multilingual 等评测基准，聚焦 大模型代码编程能力评测排行榜 方向的模型对比。

点击模型名称可进入详情页查看上下文长度、许可方式与 API 价格。数据口径说明见数据方法论。

代码能力参考综合排名

目前没有一个被普遍认可的代码能力综合排行榜。SWE-bench、HumanEval 等静态基准可以衡量特定技能，但容易被针对性优化（"刷榜"）。为此我们选取了两个切入角度不同的人类偏好参考榜单并列展示：LMArena Coding Arena 通过匿名盲测评测通用编程能力（调试、算法实现、代码生成等）；DesignArena Code Category 专注评测具有视觉呈现效果的前端代码生成（网站、UI 组件、游戏等），两者方法论相同但考察场景各异，结合参考效果最佳。

LMArena Coding Arena

完整排名

基于真实开发者提交的通用编程任务（调试、算法、代码生成）进行匿名 A/B 盲测投票，Elo 算法动态排名。

数据更新于 2026-05-28

#模型Elo

Opus 4.7 (thinking)Anthropic

1555

Claude Opus 4.6 (thinking)Anthropic

1551

Claude Opus 4.6Anthropic

1546

Opus 4.7Anthropic

1546

Claude Opus 4 (thinking-32k)Anthropic

1530

智

GLM 5.1智谱AI

1527

Muse SparkFacebook AI研究实验室

1526

qwen3.7-max-previewAlibaba

1525

Gemini 3.1 Pro PreviewGoogle Deep Mind

1525

gpt-5.5-highOpenAI

1522

来源：LMArena

基准评测

SWE-bench Verified LiveCodeBench SWE-Bench Pro - Public SWE-bench Multilingual

更多评测

参数规模:全部 3B及以下 7B 13B

榜单亮点

按 SWE-bench Verified 排序

当前 SOTA

Qwen3.6-27B

阿里巴巴

77.20SWE-bench Verified

查看详情

最佳开源

Qwen3.5-397B-A17B

阿里巴巴

76.40SWE-bench Verified−0.80

查看详情

最佳国产

Qwen3.6-35B-A3B

阿里巴巴

73.40SWE-bench Verified−3.80

查看详情

大模型性能评测结果

数据来源：DataLearnerAI

点击任意行查看模型详情；勾选左侧可对比最多 4 个模型。

排名	模型					开源情况
	Qwen3.6-27B 阿里巴巴	77.20	83.90	53.50	71.30	免费商用	详情
	Qwen3.5-397B-A17B 阿里巴巴	76.40	83.60	50.90	69.30	免费商用	详情
	Qwen3.6-35B-A3B 阿里巴巴	73.40	80.40	49.50	67.20	免费商用	详情
4	Qwen3.5-27B 阿里巴巴	72.40	80.70	—	—	免费商用	详情
5	GLM-4.7-Flash 智谱AI	59.20	—	—	—	免费商用	详情
6	Devstral Small 1.1 MistralAI	53.60	—	—	—	免费商用	详情
7	Qwen3-Coder-Flash 阿里巴巴	51.60	—	—	—	免费商用	详情
8	Devstral Small 1.0 MistralAI	46.80	—	—	—	免费商用	详情
9	GPT OSS 20B OpenAI	34.00	—	—	—	免费商用	详情
10	Qwen3-30B-A3B-2507 阿里巴巴	22.00	43.20	—	—	免费商用	详情
11	Qwen3-235B-A22B-Thinking 阿里巴巴	—	74.10	—	—	免费商用	详情
12	Qwen3-32B 阿里巴巴	—	65.70	—	—	免费商用	详情
13	Magistral-Small-2506 MistralAI	—	55.84	—	—	免费商用	详情
14	Qwen2.5-32B 阿里巴巴	—	51.20	—	—	免费商用	详情
15	Codestral MistralAI	—	31.50	—	—	不可商用	详情
16	Gemma 3 - 27B (IT) Google Deep Mind	—	29.70	—	—	免费商用	详情
17	Qwen3-30B-A3B 阿里巴巴	—	29.00	—	—	免费商用	详情