DataLearnerAI
切换导航菜单
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言
中文
中
中文
EN
English
搜索博客
中
EN
Qwen3-8B 评测结果与排名详情 | DataLearnerAI
大模型列表
Qwen3-8B
评测分析
Qwen3-8B 评测详情
Qwen3-8B 当前已收录的代表性评测结果包括 MATH-500(11 / 44,得分 97.40)、GPQA(4 / 14,得分 62)、AIME 2024(30 / 62,得分 79.40)。
评测结果
Qwen3-8B
评测结果
思考模式
全部
常规
思考
思考模式细分 (1)
全部
默认 (开启思考)
综合评估
共 1 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
开启思考
62
133 / 175
数学推理
共 3 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
开启思考
97.40
11 / 44
AIME 2024
开启思考
76
35 / 62
AIME2025
开启思考
67.30
76 / 106
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
开启思考
57.50
70 / 118
写作和创作
共 1 项评测
评测名称 / 模式
得分
排名/总数
Creative Writing
开启思考
75
21 / 23
与其他模型对比