Qwen3.6-35B-A3B 评测详情

Qwen3.6-35B-A3B 当前已收录的代表性评测结果包括 GPQA（1 / 14，得分 86）、MMLU Pro（21 / 124，得分 85.20）、LiveCodeBench（26 / 118，得分 80.40）。

评测结果

Qwen3.6-35B-A3B

评测结果

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

C-Eval

开启思考

7 / 9

GPQA

开启思考

1 / 14

MMLU Pro

开启思考

85.20

21 / 124

HLE

开启思考

21.40

91 / 149

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

开启思考

80.40

26 / 118

SWE-bench Verified

开启思考

73.40

38 / 103

SWE-bench Multilingual

开启思考

67.20

15 / 17

SWE-Bench Pro - Public

开启思考

49.50

26 / 36

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启思考

51.50

28 / 43

Tool Decathlon

开启思考

26.90

7 / 7

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

AIME 2026

开启思考

92.70

7 / 14

IMO-AnswerBench

开启思考

78.90

15 / 17

与其他模型对比

Qwen3.6-35B-A3B 评测详情

Qwen3.6-35B-A3B 当前已收录的代表性评测结果包括 GPQA（1 / 14，得分 86）、MMLU Pro（21 / 124，得分 85.20）、LiveCodeBench（26 / 118，得分 80.40）。

评测结果

Qwen3.6-35B-A3B

评测结果

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

C-Eval

开启思考

7 / 9

GPQA

开启思考

1 / 14

MMLU Pro

开启思考

85.20

21 / 124

HLE

开启思考

21.40

91 / 149

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

开启思考

80.40

26 / 118

SWE-bench Verified

开启思考

73.40

38 / 103

SWE-bench Multilingual

开启思考

67.20

15 / 17

SWE-Bench Pro - Public

开启思考

49.50

26 / 36

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启思考

51.50

28 / 43

Tool Decathlon

开启思考

26.90

7 / 7

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

AIME 2026

开启思考

92.70

7 / 14

IMO-AnswerBench

开启思考

78.90

15 / 17

与其他模型对比