DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表MiniMax-M2.7
MI

MiniMax-M2.7

推理大模型

MiniMax-M2.7

发布时间: 2026-03-18更新于: 2026-04-12 15:22:19.6586,846
在线体验GitHubHugging FaceCompare
模型参数
2290亿
上下文长度
200K
中文支持
支持
推理能力

MiniMax-M2.7 是 MiniMax 于 2026 年 3 月发布的推理大模型,采用 MoE(混合专家)架构,总参数量 2300 亿、激活参数 100 亿,支持 200K tokens 超长上下文。M2.7 最大的技术亮点是首次将模型引入自身训练循环:基于 M2.7 构建的强化学习 Harness 驱动了实验监控、日志排查、代码修复与评测循环,模型可承担相关研发工作流约 30–50% 的工作量。在软件工程方向,M2.7 在 SWE-Pro 评测上得分 56.22%,接近 GPT-5.3-Codex;在 SWE Multilingual 上达到 76.5;在专业办公场景中,GDPval-AA ELO 得分 1500,位列全球第四;工具调用基准 Toolathon 正确率 46.3%。M2.7 目前已通过 MiniMax Agent(agent.minimaxi.com)和 API 平台(platform.minimaxi.com)全量上线,API 输入定价 $0.30/1M tokens,输出 $1.20/1M tokens,不开源。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax-M2.7

模型基本信息

推理过程
支持
思考模式
思考模式 (默认)常规模式
上下文长度
200K tokens
最大输出长度
204800 tokens
模型类型
推理大模型
发布时间
2026-03-18
模型文件大小
未知
MoE架构
是
总参数 / 激活参数
2290 亿 / 100 亿
知识截止
暂无数据
MiniMax-M2.7

开源和体验地址

代码开源状态
MiniMax-Modified MIT
预训练权重开源
MiniMax-Modified MIT- 不可以商用
GitHub 源码
https://github.com/MiniMax-AI/MiniMax-M2.7
Hugging Face
https://huggingface.co/MiniMaxAI/MiniMax-M2.7
在线体验
https://agent.minimax.io/
MiniMax-M2.7

官方介绍与博客

官方论文
MiniMax M2.7: Early Echoes of Self-Evolution
DataLearnerAI博客
MiniMax M2.7 发布:模型开始帮自己训练自己
MiniMax-M2.7

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
了解不同定价模式详解
标准模式
类型适用条件输入输出
文本-$0.300/ 1M$1.20/ 1M
缓存定价Prompt缓存
类型有效期写入读取
文本5m$0.375/ 1M$0.060/ 1M
MiniMax-M2.7

评测结果

MiniMax-M2.7 当前已收录的代表性评测结果包括 IF Bench(4 / 27,得分 76)、Claw Bench(5 / 29,得分 91.70)、GPQA Diamond(35 / 175,得分 87)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
思考模式细分 (1)
全部默认 (思考模式)
工具使用
全部使用工具不使用工具

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
思考模式
87
35 / 175
HLE
思考模式
28
74 / 149

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-Bench Pro - Public
思考模式工具
56.20
11 / 36

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
思考模式工具
85
24 / 35
Terminal Bench Hard
思考模式工具
39
5 / 13

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
思考模式工具
76
4 / 27

生产力知识

共 1 项评测
评测名称 / 模式
得分
排名/总数
GDPval-AA
思考模式
50
12 / 20

长上下文能力

共 1 项评测
评测名称 / 模式
得分
排名/总数
AA-LCR
思考模式工具
69
4 / 13

OpenClaw智能体能力综合测评

共 2 项评测
评测名称 / 模式
得分
排名/总数
Claw Bench
思考模式工具
91.70
5 / 29
Pinch Bench
思考模式工具
87.10
9 / 37
查看评测深度分析与其他模型对比
MiniMax-M2.7

发布机构

MiniMaxAI
MiniMaxAI
查看发布机构详情
MiniMax-M2.7

模型解读

2026年4月12日更新:Minimax M2.7正式开源,不过需要注意的是M2.7更换了开源协议,不允许商用!商用需要获取书面授权!



M2.7是MiniMaxAI在2026年3月18日发布的模型,也是业内首个深度参与自身训练流程的大语言模型。与以往模型不同,M2.7在训练过程中主动承担了强化学习流程中数十个复杂任务的构建,包括监控实验、排查日志、修复代码和运行评测,研究员仅在需要做关键决策时介入。官方数据显示,M2.7能承担整个研发工作流约30–50%的工作量。


核心亮点:模型参与自身训练

M2.7最大的技术特点在于”模型训练模型”的闭环机制。MiniMax让M2.7在训练过程中自主优化内部的软件工程脚手架,模型自主执行了超过100轮完整的迭代循环,流程涵盖:

  • 分析失败原因
  • 规划代码改动
  • 修复并提交代码
  • 运行评测
  • 查看结果
  • 决定保留或回退

最终在内部评测中实现了30%的性能提升。这套机制使M2.7成为目前少数真正参与过自身训练迭代的商用大模型之一。


评测表现

根据官方公布的数据,M2.7在多项基准测试中相较上代M2.5均有明显提升,部分指标已接近同期顶级闭源模型水平。Artificial Analysis大模型智力指数从42分提升至50分,涨幅约20%。

评测基准M2.7M2.5Gemini 3.1 ProSonnet 4.6Opus 4.6GPT 5.4
SWE Bench Pro56.255.454.257.257.357.7
Multi-SWE Bench52.751.3—51.050.349.0
VIBE-Pro55.654.241.056.155.6—
MLE-Bench Lite66.651.566.672.775.771.2
GDPval-AA503541575558
Toolathlon46.338.348.844.847.254.6
MM-ClawBench62.757.661.864.275.473.6
Artificial Analysis504257525357

在MLE-Bench Lite(22个机器学习任务,每次24小时自主迭代)中,M2.7三次测试平均得牌率66.6%,最佳成绩为9金5银1铜,与Gemini 3.1 Pro持平。


软件工程能力

官方重点强调了M2.7在真实生产环境中的工程能力。在内部案例中,M2.7面对线上告警时可自主完成以下流程:

  1. 分析监控指标与部署时间线
  2. 连接数据库验证根本原因
  3. 优先采用非阻塞方式建索引进行止血处理
  4. 提交代码合并请求

据官方介绍,基于M2.7已多次将线上故障恢复时间压缩至三分钟以内。需注意,上述案例均为内部数据,尚无独立第三方复现。


新功能:原生 Agent Teams 支持

M2.7新增了原生的Agent Teams多智能体协作能力,支持多个AI智能体分工合作完成复杂任务。官方认为,这种能力必须内化到模型本身,单纯依靠提示词工程无法实现稳定的多智能体协作。


办公与娱乐场景

除软件工程外,M2.7在办公和娱乐场景也有所强化:

  • 金融文档分析:可读取年报和业绩会纪要,交叉对比多篇研报,自动建立营收预测模型,输出PPT、Word和Excel图表。据参与评估的金融从业者反馈,产出物可直接用作初稿。
  • 角色扮演与人设保持:强化了对话中的人设一致性,旨在将Agentic模型的使用场景从生产力工具延伸至互动娱乐。
  • OpenRoom 开源项目:MiniMax配套发布了开源原型项目OpenRoom,是一个Web界面的AI互动空间,AI角色可与场景实时互动并产生视觉反馈,可在 openroom.ai 直接体验。该项目大部分代码由AI编写,目前仍处于原型阶段。

发布信息与注意事项

  • 发布时间:2026年3月18日正式官宣(3月16日曾短暂出现在官方文档和DesignArena评测平台)
  • 接口价格:与上代M2.5保持一致,无调整
  • 开源状态:目前未宣布开源,未来情况不明
  • 可用性:已全量上线,可通过官网及API直接使用

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码