C-Eval

更新于 2026年4月22日·1,930 次浏览

问题数量: 13948
发布机构: 请选择发布机构
评测类别: 综合评估
评测指标: Accuracy
支持语言: 中文
难度等级: 基础

简介

一个涵盖人文社科、理工科等多个学科的中文多项选择题基准，用于评估模型在中文环境下的知识和推理能力。

相关资源

C-Eval评测最新大模型排名与完整榜单数据

查看 C-Eval 的最新得分、模型模式、发布时间与参数规模，快速了解当前完整榜单表现。

数据来源：DataLearnerAI

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型模式说明

许可证:

来源:

模型发布时间截止:

排名	模型				开源情况
	Qwen3-Max-Thinking 开启思考	93.70	2026-01-26	10000亿	闭源
	Qwen 3.6 Plus Preview 开启思考	93.30	2026-03-31	未知	闭源
	Qwen3.5-397B-A17B 开启思考	93.00	2026-02-16	397亿	免费商用
4	Hunyuan-T1 常规模式	91.80	2025-03-21	未知	闭源
5	Qwen3.6-27B 开启思考	91.40	2026-04-22	270亿	免费商用
6	Qwen3.5-27B 开启思考	90.50	2026-02-25	270亿	免费商用
7	Qwen3.6-35B-A3B 开启思考	90.00	2026-04-16	350亿	免费商用
8	Qwen3-32B 开启思考	87.30	2025-04-28	320亿	免费商用
9	Qwen3-32B 常规模式	83.30	2025-04-28	320亿	免费商用