Qwen 3.6 Plus Preview 于2026年3月31日正式上线,是阿里巴巴 Qwen Plus 系列的最新预览版本。相较于前代 Qwen3.5-397B-A17B(2026年2月),这次迭代用了不到两个月时间,以 DataLearner 收录的11项评测数据为基础,本文尝试梳理这个模型的真实水平。
模型基本信息
架构层面,Qwen 3.6 Plus Preview 使用了线性注意力机制与稀疏 MoE(Mixture-of-Experts)的混合设计,上下文窗口为100万 token,最大单次输出65,536 token。模型目前不开源,参数量未披露,目前通过 OpenRouter 提供免费预览访问。
一、各类别基准表现
综合知识与推理
GPQA Diamond 是目前学界公认难度较高的研究生级问答评测,Qwen 3.6 Plus Preview 得分 90.40,在162个被收录模型中排名第11。MMLU Pro 得分 88.50,在115个模型中排名第4。C-Eval 93.30,在收录的6个参测模型中排名第2。
这三项评测的共性是题目难度偏高但属于封闭式问答,不涉及外部工具调用。Qwen 3.6 Plus 在这一类别处于第一梯队。