DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表OpenAI o4 - mini
OP

OpenAI o4 - mini

推理大模型

OpenAI o4 - mini

发布时间: 2025-04-16更新于: 2025-04-19 10:57:281,265
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
200K
中文支持
支持
推理能力

OpenAI o4 - mini 是由 OpenAI 发布的 AI 模型,发布时间为 2025-04-16,定位为 推理大模型,上下文长度为 200K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

OpenAI o4 - mini

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
200K tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2025-04-16
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
OpenAI o4 - mini

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
OpenAI o4 - mini

官方介绍与博客

官方论文
Introducing OpenAI o3 and o4-mini
DataLearnerAI博客
暂无介绍博客
OpenAI o4 - mini

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$1.1$4.4
图片$1.1--
OpenAI o4 - mini

评测结果

OpenAI o4 - mini 当前已收录的代表性评测结果包括 AIME 2024(1 / 62,得分 98.70)、MMLU(2 / 65,得分 93)、AIME2025(10 / 106,得分 99.50)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
思考模式细分 (4)
全部默认 (中)思考模式高低
工具使用
全部使用工具不使用工具

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
MMLU
思考模式
93
2 / 65
GPQA Diamond
思考模式
81.40
63 / 175
MMLU Pro
思考模式
80.60
53 / 124
ARC-AGI
思考模式
58.70
36 / 65
HLE
思考模式
14.28
115 / 149

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
思考模式
68.10
59 / 103

数学推理

共 4 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
思考模式
92.70
32 / 106
AIME 2024
思考模式
93.40
5 / 62
IMO 2024
思考模式
7.70
7 / 10
IMO 2025
思考模式
3
7 / 9

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
思考模式
38.70
19 / 27
查看评测深度分析与其他模型对比
OpenAI o4 - mini

发布机构

OpenAI
OpenAI
查看发布机构详情
OpenAI o4 - mini

模型解读

o4 mini是OpenAI最新发布的推理大模型。

OpenAI o4-mini 是一款专注于快速、经济高效推理的小型化模型。尽管其规模较小,但它在数学、编码和视觉任务等领域展现出显著的性能。

该模型具备强大的推理能力,并能够有效地利用和组合ChatGPT内的各种工具,包括网络搜索、使用Python分析上传文件和数据、对视觉输入进行深度推理,甚至生成图像。o4-mini经过训练,能够判断何时以及如何使用这些工具来解决复杂问题,并生成详细且经过深思熟虑的答案。

在性能方面,o4-mini在多个基准测试中表现出色。例如,在AIME 2024和2025数学竞赛中,o4-mini是表现最佳的基准模型。当配合Python解释器使用时,o4-mini在AIME 2025上实现了99.5%的pass@1(8个一致性答案下达到100%的共识)。这体现了其有效利用工具的能力。专家评估指出,o4-mini不仅在数学、编码和视觉任务上表现优异,在非STEM任务以及数据科学等领域也超越了其前代模型o3-mini。同时,与前代推理模型相比,o4-mini在指令遵循、提供更有用和可验证的回复方面均有提升,交互时也表现得更为自然和对话化,能够更好地利用记忆和过往对话内容使回复更具个性化和相关性。

o4-mini在效率和成本方面也具有优势。由于其高效性,o4-mini支持比o3更高的使用限制,使其成为处理需要推理能力的高容量、高吞吐量任务的有力选择。在成本效益方面,o4-mini相较于o3-mini实现了提升,预计在多数实际应用场景中,o4-mini将比o3-mini更智能且更经济。

在安全性方面,OpenAI为o3和o4-mini重建了安全训练数据,增加了在生物风险、恶意软件生成和越狱等领域的拒绝提示。这使得o4-mini在内部拒绝基准测试中表现出色。同时,OpenAI还开发了系统级缓解措施来标记高风险领域的危险提示。根据评估结果,o4-mini在生物与化学、网络安全和AI自我改进三个追踪能力领域均低于“高”风险阈值。

用户可以通过多种途径访问o4-mini。ChatGPT Plus、Pro和Team用户可以在模型选择器中找到o4-mini和o4-mini-high,它们将替代此前的o3-mini和o3-mini-high。免费用户可以在提交查询前选择“Think”来体验o4-mini。开发者也可以通过Chat Completions API和Responses API使用o4-mini。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码