Gemma 4 31B 是 2026 年上半年参数效率最高的开源稠密推理模型之一——用 310 亿全激活参数,在数学和综合知识类评测上基本追平同级别最强开源竞品,但在复杂知识推理(HLE)和 Agent 任务上仍有明显差距,选择时需根据实际用途判断。
从 Gemma 3 到 Gemma 4:这次是真代际跳跃
对比同系列上代模型 Gemma 3 27B,Gemma 4 31B 的提升幅度远超正常迭代节奏,不像是渐进优化,更像是更换了核心技术路线。
(博士级专业知识推理)从 42.40 跳至 ,涨幅超过 40 个百分点;(实时编程能力)从 29.70 升至 ,几乎翻了近三倍;(系统性多学科知识)从 67.50 升至 。这种幅度在同一系列的相邻两代之间非常罕见。