MiniMaxAI开源MiniMax M2模型:Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1,开源第一,全球第五。
MiniMax正式开源MiniMax M2模型,该模型定位是“Mini 模型,Max 编码与代理工作流”。最大的特点是2300亿总参数量,但是每次推理仅激活100亿,类似于10B模型。这款模型非常火爆,原因在于这么小的激活参数数量,推理速度很快,但是其评测结果非常优秀。

目前,MiniMax M2已经开源,参考:https://www.datalearner.com/ai-models/pretrained-models/minimax-m2
MiniMax M2模型的基本信息:超稀疏MoE架构,推理速度不错!
MiniMax M2是一个MoE架构的大模型,其总参数量为2300亿,每次推理仅激活其中的100亿,非常的稀疏。上下文最高支持205K,最高支持131K的输出,支持推理过程。MiniMax M2是纯文本大模型,不支持多模态的输入。
此前,阿里在9月份开源的Qwen3-Next-80B-A3B这个下一代的大模型也是采用了远超常规的激活比例(1:26左右,参考此前分析:https://www.datalearner.com/blog/1051757449442911 )。从此处看,更加激进的稀疏混合专家架构似乎是一个非常重要的模型方向。FP8格式的MiniMax M2模型需要4台H100部署。
这种架构带来的最显而易见的优点是推理速度的提升。根据当前的官方的接口测试结果,MiniMax M2的推理速度达到了每秒84 tokens左右,上一代的Mini Max M1只有一半,约41 tokens/秒。而Claude Sonnet 4.5则只有61 tokens/秒。可以说非常不错的速度了(官方说其接口速度是Sonnet的2倍)。


