HellaSwag评测最新大模型排名与完整榜单数据
查看 HellaSwag 的最新得分、模型模式、发布时间与参数规模,快速了解当前完整榜单表现。
数据来源:DataLearnerAI
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型模式说明
HellaSwag 排名
| 排名 | 模型 | 开源情况 | |||
|---|---|---|---|---|---|
![]() Claude3-Opus 常规模式 | 95.40 | 2024-03-04 | 未知 | 闭源 | |
![]() Gemma2-27B 常规模式 | 86.40 | 2024-05-14 | 270亿 | 免费商用 | |
85.60 | 2025-03-12 | 270亿 | 免费商用 |

