BBH评测最新大模型排名与完整榜单数据
查看 BBH 的最新得分、模型模式、发布时间与参数规模,快速了解当前完整榜单表现。
数据来源:DataLearnerAI
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型模式说明
BBH 排名
| 排名 | 模型 | 开源情况 | |||
|---|---|---|---|---|---|
94.30 | 2025-06-30 | 3000亿 | 免费商用 | ||
92.60 | 2024-10-22 | 未知 | 闭源 | ||
![]() DeepSeek-V3 常规模式 | 92.30 | 2024-12-26 | 6810亿 | 免费商用 | |
4 | ![]() Hunyuan-TurboS 常规模式 | 92.20 | 2025-03-10 | 未知 | 闭源 |
5 | ![]() GPT-4o 常规模式 | 91.70 | 2024-05-13 | 未知 | 闭源 |
6 | 89.20 | 2024-07-23 | 4050亿 | 免费商用 | |
7 | 89.10 | 2025-06-27 | 800亿 | 免费商用 | |
8 | ![]() Qwen3-235B-A22B 常规模式 | 88.87 | 2025-04-28 | 2350亿 | 免费商用 |
9 | 87.60 | 2025-03-12 | 270亿 | 免费商用 | |
10 | ![]() Qwen3-Next 常规模式 | 87.13 | 2025-09-11 | 800亿 | 免费商用 |
11 | ![]() Qwen2.5-72B 常规模式 | 86.30 | 2024-09-18 | 727亿 | 免费商用 |
12 | ![]() Gemma2-27B 常规模式 | 74.90 | 2024-05-14 | 270亿 | 免费商用 |
13 | ![]() Gemma 2 - 9B 常规模式 | 68.20 | 2024-06-27 | 90亿 | 免费商用 |
14 | 65.20 | 2025-02-23 | 160亿 | 免费商用 | |
15 | ![]() Llama3.1-8B 常规模式 | 57.70 | 2024-07-23 | 80亿 | 免费商用 |
16 | ![]() Qwen2.5-3B 常规模式 | 56.30 | 2024-09-18 | 30亿 | 免费商用 |
17 | 56.10 | 2024-05-22 | 70亿 | 免费商用 | |
18 | ![]() Llama-3.2-3B 常规模式 | 46.80 | 2024-09-18 | 32亿 | 免费商用 |
19 | ![]() Gemini 1.5 Pro 常规模式 | 0.00 | 2024-02-15 | 未知 | 闭源 |
20 | ![]() Amazon Nova Pro 常规模式 | 0.00 | 2024-12-03 | 未知 | 闭源 |











