GLM-4.5

Name: GLM-4.5-MoE-355B-A32B-0715
Availability: InStock
Author: 智谱AI

推理大模型

GLM-4.5-MoE-355B-A32B-0715

发布时间: 2025-07-28更新于: 2025-07-29 11:11:411,585

在线体验 GitHub Hugging Face Compare

模型参数

3550亿

上下文长度

128K

中文支持

支持

推理能力

GLM-4.5-MoE-355B-A32B-0715 是由智谱AI 发布的 AI 模型，发布时间为 2025-07-28，定位为推理大模型，参数规模约为 3550.0B，上下文长度为 128K，模型文件大小约 710 GB，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GLM-4.5

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

97280 tokens

模型类型

推理大模型

发布时间

2025-07-28

模型文件大小

710 GB

MoE架构

是

总参数 / 激活参数

3550 亿 / 320 亿

知识截止

暂无数据

GLM-4.5

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/THUDM/GLM-4

Hugging Face

https://huggingface.co/zai-org/GLM-4.5

在线体验

https://chat.z.ai/

GLM-4.5

官方介绍与博客

官方论文

GLM-4.5: Reasoning, Coding, and Agentic Abililties

DataLearnerAI博客

Zhipu AI重磅发布GLM-4.5系列：技术深度解析与多维度性能评测

GLM-4.5

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$0.6	$2.2

GLM-4.5

评测结果

GLM-4.5 当前已收录的代表性评测结果包括 MATH-500（3 / 44，得分 98.20）、AIME 2024（14 / 62，得分 91）、MMLU Pro（30 / 124，得分 84.60）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

思考模式

84.60

30 / 124

GPQA Diamond

思考模式

79.10

77 / 175

LiveBench

常规模式

32 / 52

HLE

思考模式

14.40

113 / 149

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

思考模式

72.90

44 / 118

SWE-bench Verified

思考模式

64.20

66 / 103

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

MATH-500

思考模式

98.20

3 / 44

AIME 2024

思考模式

14 / 62

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

思考模式

37.50

15 / 35

查看评测深度分析与其他模型对比

GLM-4.5

发布机构

智谱AI

查看发布机构详情

GLM-4.5-MoE-355B-A32B-0715

模型解读

GLM-4.5-355B-A32B是智谱AI开源的MoE架构的大模型，总参数3550亿，每次推理激活320亿参数。

该模型是GLM 4.5系列中参数规模最大的一个模型。

GLM-4.5在官方公布的12项跨领域基准测试中，综合性能位列第三，展现了其作为第一梯队成员的强大实力。

Agent与工具调用能力:
这是GLM-4.5的核心优势之一。在BFCL v3（函数调用）和τ-bench（通用Agent）等基准上，其表现与Anthropic的Claude 4 Sonnet几乎持平。尤其值得注意的是，在一项涉及52个真实编码任务的Agentic Coding测试中，其工具调用成功率高达90.6%，在所有对比模型中排名第一，证明了其在与外部工具交互时的极高可靠性。
推理能力:
GLM-4.5在需要深度逻辑和知识的推理任务上表现卓越。在AIME24（数学竞赛级问题）基准上，其得分（91.0）超过了Claude 4 Opus和Gemini 2.5 Pro。在MATH 500上也取得了98.2的高分，稳居顶级水平。这表明它具备处理复杂科学、技术和数学问题的坚实基础。
代码能力:
模型在SWE-bench和Terminal-Bench等编码基准上表现出强大的竞争力。虽然与Claude 4 Sonnet这类专为代码优化的模型相比互有胜负，但其结合了高可靠性的工具调用能力，使其在需要创建和调试完整项目的全栈开发等Agentic Coding场景中极具潜力。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

模态

输入

输出

文本

$0.6

$2.2