大模型排行榜

大模型评测基准

大模型列表

大模型对比

语言中文

搜索博客

DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台，持续更新可落地的 AI 能力图谱。

产品

评测榜单
模型对比
数据资源

资源

部署教程
原创内容
工具导航

关于

关于我们
隐私政策
数据收集方法
联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例，为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款

页面导航

页面导航

大模型列表Qwen3.6-27B评测分析

Qwen3.6-27B 评测详情

Qwen3.6-27B 当前已收录的代表性评测结果包括 MMLU Pro（14 / 124，得分 86.20）、LiveCodeBench（17 / 118，得分 83.90）、GPQA Diamond（30 / 175，得分 87.80）。并附有 1 个数据来源链接供参考。

评测结果

Qwen3.6-27B

评测结果

思考模式

工具使用

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

思考模式

91.40

5 / 9

思考模式

87.80

30 / 175

思考模式

86.20

14 / 124

思考模式

24

84 / 149

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

思考模式

83.90

17 / 118

SWE-bench Verified

思考模式工具

77.20

20 / 103

SWE-bench Multilingual

思考模式工具

71.30

10 / 17

SWE-Bench Pro - Public

思考模式工具

53.50

18 / 36

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

思考模式工具

59.30

17 / 43

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

思考模式

94.10

4 / 14

IMO-AnswerBench

思考模式

80.80

14 / 17

OpenClaw智能体能力综合测评

共 1 项评测

评测名称 / 模式

得分

排名/总数

思考模式工具

72.40

27 / 29

与其他模型对比

数据来源