大模型排行榜

大模型评测基准

大模型列表

大模型对比

语言中文

搜索博客

DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台，持续更新可落地的 AI 能力图谱。

产品

评测榜单
模型对比
数据资源

资源

部署教程
原创内容
工具导航

关于

关于我们
隐私政策
数据收集方法
联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例，为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款

Qwen3-8B 评测结果与排名详情 | DataLearnerAI

页面导航

页面导航

大模型列表Qwen3-8B评测分析

Qwen3-8B 评测详情

Qwen3-8B 当前已收录的代表性评测结果包括 MATH-500（11 / 44，得分 97.40）、GPQA（4 / 14，得分 62）、AIME 2024（30 / 62，得分 79.40）。

评测结果

Qwen3-8B

评测结果

思考模式

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

常规模式

72.50

84 / 124

常规模式

39.30

162 / 175

开启思考

62

133 / 175

常规模式

62

4 / 14

数学推理

共 6 项评测

评测名称 / 模式

得分

排名/总数

常规模式

87.40

40 / 44

开启思考

97.40

11 / 44

常规模式

79.40

30 / 62

开启思考

76

35 / 62

常规模式

20.90

104 / 106

开启思考

67.30

76 / 106

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

常规模式

61.80

66 / 118

开启思考

57.50

70 / 118

写作和创作

共 2 项评测

评测名称 / 模式

得分

排名/总数

Creative Writing

常规模式

64.50

23 / 23

Creative Writing

开启思考

75

21 / 23

与其他模型对比