DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页模型对比Qwen3-235B-A22B与GPT OSS 120B模型对比

Qwen3-235B-A22B与GPT OSS 120B模型对比

自动展示选中模型的核心信息与各评测得分,可左右滑动查看完整表格。 当前对比 2 个模型的评测数据与核心参数。

249 次浏览

Qwen3-235B-A22B-Thinking在四项评测基准(知识问答、常识推理、数学推理)中整体领先GPT OSS 120B,尤其在高难度数学推理(AIME2025)中优势明显。同时,Qwen在上下文长度和推理精度上更适合复杂任务,但GPT OSS 120B在输出长度上具有压倒性优势,并且API价格更低,适合长输出、大批量生成的场景。

洞察结论

  1. 评测性能差异显著 Qwen在MMLU Pro、HLE和AIME2025中均有明显领先,其中数学推理(92.3 vs 83)差距最大,显示其在复杂逻辑与计算能力上的优化成效。 两者在GPQA Diamond(常识推理)差距较小,仅领先1分,说明在一般推理任务上性能接近。
  2. 架构与参数布局差异 Qwen总参数量(305B)和激活参数量(33B)高于GPT OSS 120B(117B/51B),体现不同的MoE激活策略:Qwen激活参数量更小但总量更大,可能更注重稀疏激活效率。 GPT OSS模型体积达240GB,是Qwen(31.17GB)的近8倍,部署成本更高。
  3. 上下文与输出能力的互补性 Qwen支持最大256K上下文,适合长文档理解与多轮推理。 GPT OSS 120B的最大输出长度(131,072 tokens)远超Qwen(16,384 tokens),在长篇生成或批量产出中更具优势。
  4. 价格与商用取向 GPT OSS 120B输入价格(0.15 美元/百万tokens)和输出价格(0.6美元)均低于Qwen(0.2 / 2.4美元),在大规模推理与生成任务中成本更优。 两者均允许免费商用,但GPT OSS 120B的低价策略可能更易被广泛采用。
阿里巴巴

Qwen3-235B-A22B-Thinking

阿里巴巴

发布时间
2025-07-30
上下文
256K
参数量
305 (act 33)
最大输出
16,384 tokens
支持模态
思考模式(Thinking Mode)
查看详情·在线体验

综合领先

Qwen3-235B-A22B-Thinking · 67.88

单项最高

GPT OSS 120B · AIME2025 97.90

模态覆盖

Qwen3-235B-A22B-Thinking · 1 种模态

正面对比

Qwen3-235B-A22B-Thinking
3
2
GPT OSS 120B
领先持平落后

5

评测基准

3

领先项

2

落后项

+1.57

平均分差

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

思考模式
工具使用
联网能力
筛选: 最佳可用·2 个模式 · 5 评测基准
图表加载中...

评测得分表格

完整列出各模型/模式的评测得分,便于横向比较。

5 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。

评测项Qwen3-235B-A22B-ThinkingGPT OSS 120B
GPQA Diamond
综合评估
81.10开启思考
80.10开启思考
HLE
综合评估
18.20开启思考
19.00开启思考 | 工具
LiveBench
综合评估
63.42开启思考
55.56常规模式
MMLU Pro
综合评估
84.40开启思考
79.00开启思考
AIME2025
数学推理
92.30开启思考
97.90开启思考 | 工具

API 价格对比

输入输出 token 价格并排展示

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格
Qwen3-235B-A22B-Thinking阿里巴巴
GPT OSS 120BOpenAI
核心规格发布时间
2025-07-302025-08-06
上下文
256K128K
参数量
305117
激活参数量
3351
最大输出
16384131072
MoE 架构
支持支持
支持模式
思考模式(Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
开源与许可代码开源
未提供未提供
权重开源
未提供未提供
商业授权
免费商用授权免费商用授权
模态支持文本 输入/输出
/
/
图片 输入/输出
/
/
音频 输入/输出
/
/
视频 输入/输出
/
/
Embedding 输入/输出
/
/
资料来源论文 / 报告
Qwen3: Think Deeper, Act FasterIntroducing gpt-oss
DataLearner 博客
未提供OpenAI开源2个全新大模型,比肩o3-mini的GPT-OSS-20B和比肩o4-mini的GPT-120B,完全免费商用授权
OpenAI

GPT OSS 120B

OpenAI

发布时间
2025-08-06
上下文
128K
参数量
117 (act 51)
最大输出
131,072 tokens
支持模态
常规模式(Non-Thinking Mode) · 思考模式(Thinking Mode)
查看详情