DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GLM-4.5-Air
GL

GLM-4.5-Air

推理大模型

GLM-4.5-MoE-106B-A12B-0715

发布时间: 2025-07-28更新于: 2025-07-29 11:13:421,527
在线体验GitHubHugging FaceCompare
模型参数
1060亿
上下文长度
128K
中文支持
支持
推理能力

GLM-4.5-MoE-106B-A12B-0715 是由 智谱AI 发布的 AI 模型,发布时间为 2025-07-28,定位为 推理大模型,参数规模约为 1060.0B,上下文长度为 128K,模型文件大小约 212 GB,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GLM-4.5-Air

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
97280 tokens
模型类型
推理大模型
发布时间
2025-07-28
模型文件大小
212 GB
MoE架构
是
总参数 / 激活参数
1060 亿 / 120 亿
知识截止
暂无数据
GLM-4.5-Air

开源和体验地址

代码开源状态
Apache 2.0
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
https://github.com/THUDM/GLM-4
Hugging Face
https://huggingface.co/zai-org/GLM-4.5-Air
在线体验
https://chat.z.ai/
GLM-4.5-Air

官方介绍与博客

官方论文
GLM-4.5: Reasoning, Coding, and Agentic Abililties
DataLearnerAI博客
Zhipu AI重磅发布GLM-4.5系列:技术深度解析与多维度性能评测
GLM-4.5-Air

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.2$1.1
GLM-4.5-Air

评测结果

GLM-4.5-Air 当前已收录的代表性评测结果包括 MATH-500(5 / 44,得分 98.10)、AIME 2024(15 / 62,得分 89.40)、Pinch Bench(13 / 37,得分 85.70)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考
工具使用
全部使用工具不使用工具

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
思考模式
81.40
49 / 124
GPQA Diamond
思考模式
75
91 / 175
LiveBench
常规模式
60.53
41 / 52
HLE
思考模式
10.60
122 / 149

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
思考模式
70.70
47 / 118
SWE-bench Verified
思考模式
57.60
75 / 103

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
思考模式
98.10
5 / 44
AIME 2024
思考模式
89.40
15 / 62

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
思考模式
30
22 / 35

OpenClaw智能体能力综合测评

共 1 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
思考模式工具
85.70
13 / 37
查看评测深度分析与其他模型对比
GLM-4.5-Air

发布机构

智谱AI
智谱AI
查看发布机构详情
GLM-4.5-MoE-106B-A12B-0715

模型解读

GLM-4.5-106B-A12B是智谱AI开源的MoE架构的大模型,总参数1060亿,每次推理激活120亿参数。


在官方的帕累托前沿分析中,GLM-4.5-Air被定位为同等规模下性能最优的模型之一。在12项基准测试中,其综合性能位列第六,超过了许多更大规模的模型。

  • Agent与工具调用能力:令人印象深刻的是,GLM-4.5-Air在核心Agent任务上的表现与旗舰版的GLM-4.5相差无几。在τ-bench(69.4 vs 70.1)和BFCL v3(76.4 vs 77.8)基准上,其分数非常接近,这意味着用户可以用更低的成本获得几乎同等水平的函数调用和基础Agent能力。
  • 推理能力:GLM-4.5-Air的推理能力依然强劲。在AIME24和MATH 500等数学基准上,其得分(89.4和98.1)依然处于顶级水平。虽然在MMLU Pro等更广泛的知识性基准上与GLM-4.5有一定差距,但其表现足以应对绝大多数商业和个人应用中的推理需求。
  • 代码能力:在代码能力上,GLM-4.5-Air与旗舰版存在一定差距,特别是在复杂的软件工程任务SWE-bench上(57.6 vs 64.2)。尽管如此,它的性能依然足以胜任日常的编码辅助、代码片段生成和简单的脚本编写任务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码