DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GLM-4.5
GL

GLM-4.5

推理大模型

GLM-4.5-MoE-355B-A32B-0715

发布时间: 2025-07-28更新于: 2025-07-29 11:11:411,585
在线体验GitHubHugging FaceCompare
模型参数
3550亿
上下文长度
128K
中文支持
支持
推理能力

GLM-4.5-MoE-355B-A32B-0715 是由 智谱AI 发布的 AI 模型,发布时间为 2025-07-28,定位为 推理大模型,参数规模约为 3550.0B,上下文长度为 128K,模型文件大小约 710 GB,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GLM-4.5

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
97280 tokens
模型类型
推理大模型
发布时间
2025-07-28
模型文件大小
710 GB
MoE架构
是
总参数 / 激活参数
3550 亿 / 320 亿
知识截止
暂无数据
GLM-4.5

开源和体验地址

代码开源状态
Apache 2.0
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
https://github.com/THUDM/GLM-4
Hugging Face
https://huggingface.co/zai-org/GLM-4.5
在线体验
https://chat.z.ai/
GLM-4.5

官方介绍与博客

官方论文
GLM-4.5: Reasoning, Coding, and Agentic Abililties
DataLearnerAI博客
Zhipu AI重磅发布GLM-4.5系列:技术深度解析与多维度性能评测
GLM-4.5

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.6$2.2
GLM-4.5

评测结果

GLM-4.5 当前已收录的代表性评测结果包括 MATH-500(3 / 44,得分 98.20)、AIME 2024(14 / 62,得分 91)、MMLU Pro(30 / 124,得分 84.60)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
思考模式
84.60
30 / 124
GPQA Diamond
思考模式
79.10
77 / 175
LiveBench
常规模式
65
32 / 52
HLE
思考模式
14.40
113 / 149

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
思考模式
72.90
44 / 118
SWE-bench Verified
思考模式
64.20
66 / 103

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
思考模式
98.20
3 / 44
AIME 2024
思考模式
91
14 / 62

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
思考模式
37.50
15 / 35
查看评测深度分析与其他模型对比
GLM-4.5

发布机构

智谱AI
智谱AI
查看发布机构详情
GLM-4.5-MoE-355B-A32B-0715

模型解读

GLM-4.5-355B-A32B是智谱AI开源的MoE架构的大模型,总参数3550亿,每次推理激活320亿参数。


该模型是GLM 4.5系列中参数规模最大的一个模型。


GLM-4.5在官方公布的12项跨领域基准测试中,综合性能位列第三,展现了其作为第一梯队成员的强大实力。

  • Agent与工具调用能力:
    这是GLM-4.5的核心优势之一。在BFCL v3(函数调用)和τ-bench(通用Agent)等基准上,其表现与Anthropic的Claude 4 Sonnet几乎持平。尤其值得注意的是,在一项涉及52个真实编码任务的Agentic Coding测试中,其工具调用成功率高达90.6%,在所有对比模型中排名第一,证明了其在与外部工具交互时的极高可靠性。
  • 推理能力:
    GLM-4.5在需要深度逻辑和知识的推理任务上表现卓越。在AIME24(数学竞赛级问题)基准上,其得分(91.0)超过了Claude 4 Opus和Gemini 2.5 Pro。在MATH 500上也取得了98.2的高分,稳居顶级水平。这表明它具备处理复杂科学、技术和数学问题的坚实基础。
  • 代码能力:
    模型在SWE-bench和Terminal-Bench等编码基准上表现出强大的竞争力。虽然与Claude 4 Sonnet这类专为代码优化的模型相比互有胜负,但其结合了高可靠性的工具调用能力,使其在需要创建和调试完整项目的全栈开发等Agentic Coding场景中极具潜力。

    DataLearner 官方微信

    欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

    DataLearner 官方微信二维码