DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜Arcada Labs Code Categories Arena 代码能力排行榜

Arcada Labs Code Categories Arena 代码能力排行榜

基于 Arcada Labs Code Categories Arena 用户匿名投票的最新AI大模型代码能力排行榜,通过 Bradley-Terry 模型对 Website、UI Component、Game Dev、Data Visualization 等代码子类别进行综合评分与排名。

榜首模型

Kimi K2.6

最高得分

1337.00

模型数量

127

数据版本

2026年05月31日

数据来源: Arcada Labs

来源:全部国产模型
榜单历史快照月份:

排名总表

排名模型名称得分95% CI投票数机构许可证
4Moonshot AIKimi K2.6Moonshot AI1337.00—15,535Moonshot AIOpen Source
5ZHGLM 5.1Zhipu AI1336.00—5,197Zhipu AIOpen Source
8ZHGLM 5 TurboZhipu AI1329.00—14,085Zhipu AIProprietary
10AlibabaQwen3.7 MaxAlibaba1314.00—7,534AlibabaProprietary
13DeepSeekDeepSeek-V4-ProDeepSeek1306.00—9,410DeepSeekOpen Source
15ZHGLM 5Zhipu AI1302.00—30,971Zhipu AIOpen Source
19Moonshot AIKimi K2.5 (Thinking)Moonshot AI1294.00—30,129Moonshot AIOpen Source
20MiniMaxMiniMax M2.7MiniMax1286.00—24,347MiniMaxOpen Source
25ZHGLM 4.7Zhipu AI1275.00—38,816Zhipu AIOpen Source
27DeepSeekDeepSeek-V4-FlashDeepSeek1270.00—15,684DeepSeekOpen Source
30MiniMaxMiniMax M2.5MiniMax1262.00—11,504MiniMaxOpen Source
34MiniMaxMiniMax M2.1MiniMax1245.00—20,892MiniMaxOpen Source
40ZHGLM 4.7 FlashZhipu AI1233.00—11,706Zhipu AIOpen Source
42DeepSeekDeepSeek-V3.1 (Thinking)DeepSeek1231.00—16,327DeepSeekOpen Source
44DeepSeek-AIDeepSeek V3.2-ExpDeepSeek-AI1226.00—19,549DeepSeek-AIOpen Source
49AlibabaQwen3.5 Plus 02-15Alibaba1223.00—17,272AlibabaProprietary
50DeepSeek-AIDeepSeek V3.2DeepSeek-AI1222.00—24,178DeepSeek-AIOpen Source
53ZHGLM 4.6Zhipu AI1221.00—16,997Zhipu AIOpen Source
54ZHGLM 4.5Zhipu AI1220.00—19,727Zhipu AIOpen Source
58StepFunStep 3.7 FlashStepFun1216.00—3,137StepFunOpen Source
66AlibabaQwen3 Coder 480B A35B InstructAlibaba1198.00—1,958AlibabaOpen Source
69DeepSeek-AIDeepSeek-R1-0528DeepSeek-AI1194.00—18,052DeepSeek-AIOpen Source
70ZHGLM 4.5 AirZhipu AI1193.00—17,361Zhipu AIOpen Source
72MiniMaxMiniMax M2 StableMiniMax1190.00—10,933MiniMaxOpen Source
79DeepSeek-AIDeepSeek-V3.1DeepSeek-AI1167.00—20,375DeepSeek-AIOpen Source
80AlibabaQwen3 MaxAlibaba1167.00—32,079AlibabaProprietary
81DeepSeek-AIDeepSeek-V3-0324DeepSeek-AI1163.00—19,366DeepSeek-AIOpen Source
84Moonshot AIKimi K2 0905 PreviewMoonshot AI1153.00—1,504Moonshot AIOpen Source
90Moonshot AIKimi K2 Turbo PreviewMoonshot AI1139.00—2,096Moonshot AIOpen Source
101Moonshot AI (Legacy)Kimi K2Moonshot AI (Legacy)1089.00—1,352Moonshot AI (Legacy)Open Source
103AlibabaQwen3-235B-A22B-Thinking-2507Alibaba1088.00—6,169AlibabaOpen Source
110AlibabaQwen3-235B-A22BAlibaba1057.00—5,154AlibabaOpen Source
118AlibabaQwen3 30B-A3BAlibaba997.00—2,575AlibabaOpen Source

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。

关于本榜单

本榜单数据来源于Design Arena,由 Y Combinator 支持的 Arcada Labs 开发,是专注于评测 AI 设计代码生成能力的众包匿名对战平台。

与 LMArena 评测通用文本和编程能力不同,Design Arena 的代码榜专门考察模型生成具有视觉呈现效果的前端代码的能力。平台将代码任务细分为 Website、UI 组件、游戏开发、数据可视化、SVG、Web App、移动端等多个子类别,每个子类别均有独立排行。

本页展示的是 Code Categories 综合榜,即将所有子类别的用户投票混合汇总后,统一用 Bradley-Terry 模型(类 Elo 算法)计算出的综合排名。每票等权,不对各子类别做加权处理,因此投票量较大的子类别(如 Website)对综合分数的影响更大。得分越高,代表模型在设计代码生成场景下的综合人类偏好越强。

常见问题 (FAQ)

01

什么是 Arcada Labs Code Categories Arena?

Arcada Labs Code Categories Arena 是专注于设计代码生成能力的匿名评测平台,覆盖 Website、UI 组件、游戏开发、数据可视化等多个代码生成子类别,并将投票汇总为综合榜单。

02

Arcada Code Arena 与 LMArena Coding Arena 有什么区别?

LMArena Coding Arena 主要评测通用编程能力,例如代码生成、调试和算法实现;Arcada Code Arena 专注于具有视觉呈现效果的前端设计代码,例如 HTML 页面、交互 UI、图表、SVG 和原型。

03

排名方法论是什么?

Arcada Labs 将各代码子类别的原始投票混合后运行 Bradley-Terry 模型。每票等权,不按子类别单独加权,因此投票量较大的子类别会对综合分数产生更大影响。

04

哪类模型在设计代码场景表现更好?

具备强视觉理解和前端代码生成能力的大模型通常表现更好。针对 UI 和代码生成优化的专项模型,在布局、交互和视觉细节任务上也可能有突出表现。