大模型排行榜

大模型评测基准

大模型列表

大模型对比

语言中文

搜索博客

DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台，持续更新可落地的 AI 能力图谱。

产品

评测榜单
模型对比
数据资源

资源

部署教程
原创内容
工具导航

关于

关于我们
隐私政策
数据收集方法
联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例，为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款

GPT-5.4 Pro 评测结果分析与模型对比 | DataLearnerAI

页面导航

页面导航

大模型列表GPT-5.4 Pro评测分析

GPT-5.4 Pro 评测详情

GPT-5.4 Pro 当前已收录的代表性评测结果包括 GPQA Diamond（2 / 175，得分 94.40）、HLE（2 / 149，得分 58.70）、BrowseComp（2 / 43，得分 89.30）。并附有 2 个数据来源链接供参考。

评测结果

GPT-5.4 Pro

评测结果

思考模式

工具使用

联网能力

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

高

94.50

5 / 65

高

94.40

2 / 175

高

83.30

5 / 58

高

42.70

38 / 149

高工具

58.70

2 / 149

数学推理

共 5 项评测

评测名称 / 模式

得分

排名/总数

高

50

3 / 60

极高

50

3 / 60

FrontierMath - Tier 4

常规模式工具联网

37.50

5 / 80

FrontierMath - Tier 4

高

38

4 / 80

FrontierMath - Tier 4

极高

37.50

5 / 80

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

高工具

89.30

2 / 43

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

高工具

82

7 / 20

与其他模型对比

数据来源

openai.comopenai.com epoch.aiepoch.ai