法国人工智能初创企业MistralAI发布首个推理模型Magistral：纯RL训练，多语言能力出色，推理速度很快，Magistral Small (24B)版本免费开源，但面对Qwen3和DeepSeek稍显乏力

Mistral AI今天发布了其首个专注于推理能力的系列模型——Magistral。这次发布包含两个核心模型：旗舰模型Magistral Medium和已开源的Magistral Small (24B)。最引人注目的亮点是，Mistral展示了其自研的强化学习（RL）pipeline能够从头开始，仅通过RL训练就将基础模型的推理能力提升到业界顶尖水平，而无需依赖任何其他预先存在的推理模型进行数据蒸馏。这套技术栈非常强大！

Mistral发布首个推理模型Magistral：纯RL训练带来性能飞跃，开源24B模型

Magistral模型简介

Mistral AI是法国的一家大模型初创企业，此前最著名的事情是业界最早开源MoE模型的企业，即Mixtral 8*22B，当时因为其直接开源，效果良好引起了大模型业界的追捧。但是，随着DeepSeek和Qwen系列模型的开源，以及Mistral转为商业目标为重心之后，它们在业界的影响力大大减少，不管是开源模型的节奏、数量还是质量都似乎不够吸引人了。

任务	SFT-only	RL-only	SFT + RL (Magistral Small)
AIME'24 (pass@1)	65.4%	65.8%	70.7%
AIME'25 (pass@1)	55.6%	51.9%	62.8%
MATH-500	93.2%	95.4%	95.9%
LiveCodeBench (v5)	52.2%	46.4%	55.8%

能力类别	基准测试	Mistral Medium 3	Magistral Medium
函数调用	Internal bench	87.2	87.4
指令遵循	IFEval	86.8	87.4

语言	AIME'24 (pass@1) 性能
English	73.6%
French	68.5%
Spanish	69.3%
German	66.8%
Italian	66.7%
Russian	65.0%
Chinese	63.7%

法国人工智能初创企业MistralAI发布首个推理模型Magistral：纯RL训练，多语言能力出色，推理速度很快，Magistral Small (24B)版本免费开源，但面对Qwen3和DeepSeek稍显乏力

Magistral模型简介

DataLearner 官方微信

Magistral性能评测：推理能力大幅提升

Magistral核心技术解析：自研RL框架与GRPO算法

意外之喜：RL训练带来的“免费午餐”

Magistral模型的多语言能力

Magistral的开源情况和总结

热门博客