DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜LMArena Coding Arena 代码能力排行榜

LMArena 评测赛道

文本生成代码数学图像编辑文字生成视频图生视频文生图

LMArena Coding Arena 代码能力排行榜

基于 LMArena Coding Arena 用户匿名投票的最新AI大模型代码编程能力排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

qwen3.7-max-preview

最高得分

1525.00

模型数量

355

数据版本

2026年05月28日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前 AI 大模型在代码编程任务中的实力排名。数据来源于 LMArena (前身为 LMSYS Chatbot Arena)的 Coding 子赛道,通过真实用户匿名盲测投票评估各模型在代码编程任务中的表现。

评测方法概要

匿名盲测:用户发出编程问题后,由两个"隐藏身份"的模型分别给出代码解答,用户投票选出更好的回答,排除品牌偏见。

Elo 评分:采用 Bradley-Terry 模型计算 Elo 分数,分数越高说明该模型的代码回答越容易被用户选择。

覆盖多种编程场景:包括代码生成、Bug 修复、算法实现、代码解释等高频真实编程场景。

DataLearner 在原始数据基础上提供中文解读与深度分析,并将排行榜模型关联至 DataLearner 模型库,方便您一键查看模型详情、API 定价、评测得分等完整信息。

来源:全部国产模型
榜单历史快照月份:

排名总表

排名模型名称得分95% CI投票数机构许可证
8Alibabaqwen3.7-max-previewAlibaba1525.00+/-181,137AlibabaProprietary
18Baiduernie-5.1Baidu1515.00+/-103,943BaiduProprietary
22Alibabaqwen3.5-max-previewAlibaba1514.00+/-85,491AlibabaProprietary
23Moonshotkimi-k2.6Moonshot1514.00+/-104,237MoonshotModified MIT
27Bytedancedola-seed-2.0-proBytedance1511.00+/-710,045BytedanceProprietary
32Alibabaqwen3.6-max-previewAlibaba1506.00+/-161,327AlibabaProprietary
33Moonshotkimi-k2.5-instantMoonshot1505.00+/-141,803MoonshotModified MIT
35Moonshot AIKimi K2 ThinkingMoonshot AI1503.00+/-79,469Moonshot AIModified MIT
38DeepSeekdeepseek-v4-proDeepSeek1500.00+/-94,940DeepSeekMIT
46DeepSeekdeepseek-v4-pro-thinkingDeepSeek1494.00+/-94,535DeepSeekMIT
50Alibabaqwen3.6-plusAlibaba1492.00+/-95,403AlibabaProprietary
56Moonshotkimi-k2-thinking-turboMoonshot1487.00+/-614,116MoonshotModified MIT
63DeepSeekdeepseek-v4-flashDeepSeek1479.00+/-94,780DeepSeekMIT
64DeepSeekdeepseek-v4-flash-thinkingDeepSeek1478.00+/-94,709DeepSeekMIT
65MiniMaxAIMiniMax-M2.7MiniMaxAI1475.00+/-86,572MiniMaxAIModified MIT
66Alibabaqwen3-max-2025-09-23Alibaba1475.00+/-132,042AlibabaProprietary
67DeepSeek-AIDeepSeek V3.2 (thinking)DeepSeek-AI1475.00+/-78,193DeepSeek-AIMIT
69DeepSeek-AIDeepSeek V3.2-Exp (thinking)DeepSeek-AI1474.00+/-131,919DeepSeek-AIMIT
75DeepSeek-AIDeepSeek V3.2DeepSeek-AI1469.00+/-710,179DeepSeek-AIMIT
77Moonshotkimi-k2-0905-previewMoonshot1467.00+/-132,243MoonshotModified MIT
79DeepSeek-AIDeepSeek V3.2-ExpDeepSeek-AI1466.00+/-122,501DeepSeek-AIMIT
82DeepSeek-AIDeepSeek-R1-0528DeepSeek-AI1465.00+/-112,728DeepSeek-AIMIT
86DeepSeekdeepseek-v3.1-terminus-thinkingDeepSeek1463.00+/-24636DeepSeekMIT
88Tencenthunyuan-hy3-previewTencent1462.00+/-151,648Tencenttencent-hunyuan-community
90Moonshot AIKimi K2Moonshot AI1460.00+/-85,244Moonshot AIModified MIT
96Alibabaqwen3-coder-480b-a35b-instructAlibaba1457.00+/-94,849AlibabaApache 2.0
97DeepSeek-AIDeepSeek-V3.1 (thinking)DeepSeek-AI1457.00+/-131,904DeepSeek-AIMIT
100Alibabaqwen3-vl-235b-a22b-thinkingAlibaba1455.00+/-141,625AlibabaApache 2.0
101Alibabaqwen3.5-122b-a10bAlibaba1455.00+/-87,029AlibabaApache 2.0
105Alibabaqwen3.5-27bAlibaba1448.00+/-86,863AlibabaApache 2.0
106DeepSeek-AIDeepSeek-V3.1DeepSeek-AI1448.00+/-122,624DeepSeek-AIMIT
107StepFunAIStep 3.5 FlashStepFunAI1447.00+/-78,364StepFunAIApache 2.0
108Alibabaqwen3-next-80b-a3b-instructAlibaba1446.00+/-94,794AlibabaApache 2.0
109Alibabaqwen3-235b-a22b-no-thinkingAlibaba1446.00+/-86,975AlibabaApache 2.0
111DeepSeek-AIDeepSeek-R1DeepSeek-AI1444.00+/-122,317DeepSeek-AIMIT
112MiniMaxAIMiniMax M2.5MiniMaxAI1444.00+/-79,266MiniMaxAIModified MIT
114Alibabaqwen3-235b-a22b-thinking-2507Alibaba1442.00+/-151,611AlibabaApache 2.0
116Alibabaqwen3-30b-a3b-instruct-2507Alibaba1440.00+/-94,660AlibabaApache 2.0
117MiniMaxminimax-m2.1-previewMiniMax1439.00+/-103,426MiniMaxMIT
118DeepSeek-AIDeepSeek-V3.1 TerminusDeepSeek-AI1439.00+/-21778DeepSeek-AIMIT
119Tencenthunyuan-vision-1.5-thinkingTencent1438.00+/-27437TencentProprietary
121Alibabaqwen3.5-35b-a3bAlibaba1437.00+/-87,198AlibabaApache 2.0
126Alibabaqwen3-235b-a22bAlibaba1433.00+/-94,339AlibabaApache 2.0
131Alibabaqwen3.5-flashAlibaba1432.00+/-78,187AlibabaProprietary
136DeepSeek-AIDeepSeek-V3-0324DeepSeek-AI1429.00+/-78,372DeepSeek-AIMIT
141Alibabaqwen3-next-80b-a3b-thinkingAlibaba1421.00+/-112,677AlibabaApache 2.0
146MiniMaxminimax-m1MiniMax1416.00+/-86,489MiniMaxApache 2.0
153StepFunstep-3StepFun1408.00+/-171,233StepFunApache 2.0
154Alibabaqwen3-32bAlibaba1408.00+/-24513AlibabaApache 2.0
157Alibabaqwen2.5-maxAlibaba1403.00+/-85,101AlibabaProprietary
158Tencenthunyuan-t1-20250711Tencent1400.00+/-20805TencentProprietary
159Tencenthunyuan-turbos-20250226Tencent1400.00+/-31275TencentProprietary
164Tencenthunyuan-turbos-20250416Tencent1394.00+/-141,776TencentProprietary
172DeepSeekdeepseek-v3DeepSeek1388.00+/-103,280DeepSeekDeepSeek
173Alibabaqwen3-30b-a3bAlibaba1387.00+/-94,531AlibabaApache 2.0
176Alibabaqwq-32bAlibaba1385.00+/-94,046AlibabaApache 2.0
178MiniMaxminimax-m2MiniMax1384.00+/-151,547MiniMaxApache 2.0
182Alibabaqwen-plus-0125Alibaba1380.00+/-18893AlibabaProprietary
184DeepSeekdeepseek-v2.5-1210DeepSeek1375.00+/-171,079DeepSeekDeepSeek
187Tencenthunyuan-turbo-0110Tencent1372.00+/-30299TencentProprietary
188StepFunstep-2-16k-exp-202412StepFun1371.00+/-20737StepFunProprietary
193DeepSeekdeepseek-v2.5DeepSeek1368.00+/-94,252DeepSeekDeepSeek
196Tencenthunyuan-large-2025-02-10Tencent1367.00+/-25519TencentProprietary
207Alibabaqwen2.5-plus-1127Alibaba1357.00+/-141,553AlibabaProprietary
209Tencenthunyuan-large-visionTencent1356.00+/-19964TencentProprietary
210Alibabaqwen2.5-72b-instructAlibaba1355.00+/-86,688AlibabaQwen
213StepFunstep-1o-turbo-202506StepFun1353.00+/-151,504StepFunProprietary
214Alibabaqwen-max-0919Alibaba1353.00+/-112,756AlibabaQwen
224Alibabaqwen2.5-coder-32b-instructAlibaba1342.00+/-19873AlibabaApache 2.0
225DeepSeekdeepseek-coder-v2DeepSeek1342.00+/-122,671DeepSeekDeepSeek License
231Tencenthunyuan-standard-2025-02-10Tencent1332.00+/-24549TencentProprietary
254Tencenthunyuan-standard-256kTencent1300.00+/-25497TencentProprietary
256Alibabaqwen2-72b-instructAlibaba1296.00+/-96,249AlibabaQianwen LICENSE
265Alibabaqwen1.5-110b-chatAlibaba1279.00+/-104,763AlibabaQianwen LICENSE
270Alibabaqwen1.5-72b-chatAlibaba1274.00+/-106,370AlibabaQianwen LICENSE
280Alibabaqwen1.5-32b-chatAlibaba1261.00+/-113,930AlibabaQianwen LICENSE
288INinternlm2_5-20b-chatInternLM1247.00+/-141,684InternLMOther
294Alibabaqwen1.5-14b-chatAlibaba1238.00+/-133,208AlibabaQianwen LICENSE
301DeepSeekdeepseek-llm-67b-chatDeepSeek1216.00+/-24649DeepSeekDeepSeek License
303Alibabaqwen1.5-7b-chatAlibaba1208.00+/-21772AlibabaQianwen LICENSE
309Alibabaqwen-14b-chatAlibaba1196.00+/-24599AlibabaQianwen LICENSE
321Alibabaqwq-32b-previewAlibaba1173.00+/-24566AlibabaApache 2.0
339Alibabaqwen1.5-4b-chatAlibaba1130.00+/-171,283AlibabaQianwen LICENSE

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。

常见问题 (FAQ)

01

什么是 LMArena Coding Arena?

LMArena Coding Arena 是 LMArena 旗下专注于代码能力的匿名评测平台。用户提交真实编程任务(如调试、代码生成、算法实现),系统将不同模型的输出并排展示(隐藏模型名称),由用户投票选出更好的答案,最终通过 Elo 算法汇总形成动态排行榜。

02

Coding Arena 与 SWE-bench、HumanEval 等静态基准有什么区别?

SWE-bench、HumanEval、MBPP 等静态基准使用固定测试集和自动化评分,可重现性强但容易被针对性优化("刷榜")。Coding Arena 来自真实用户的开放式需求,测试内容不固定,更能反映模型在实际编程场景中的表现,两者互为补充。

03

国产大模型在代码能力方面表现如何?

DeepSeek、Qwen 等国产模型在 Coding Arena 表现亮眼,已跻身全球前列。DeepSeek 以 MIT 协议开源,Qwen 系列支持中文编程场景,是开发者选择开源代码模型的重要参考。

04

如何用 AI 辅助日常编程工作?

常见场景包括:代码补全与生成、调试、代码审查、单元测试生成,以及跨语言翻译。