DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Step 3.5 Flash
ST

Step 3.5 Flash

聊天大模型

Step 3.5 Flash

发布时间: 2026-02-02更新于: 2026-03-08 21:06:202,745
在线体验GitHubHugging FaceCompare
模型参数
1960亿
上下文长度
256K
中文支持
支持
推理能力

Step 3.5 Flash 是由 StepFunAI 发布的 AI 模型,发布时间为 2026-02-02,定位为 聊天大模型,参数规模约为 1960.0B,上下文长度为 256K,模型文件大小约 399GB,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Step 3.5 Flash

模型基本信息

推理过程
支持
思考模式
常规模式
上下文长度
256K tokens
最大输出长度
16384 tokens
模型类型
聊天大模型
发布时间
2026-02-02
模型文件大小
399GB
MoE架构
是
总参数 / 激活参数
1960 亿 / 110 亿
知识截止
暂无数据
Step 3.5 Flash

开源和体验地址

代码开源状态
Apache 2.0
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
https://github.com/stepfun-ai/Step-3.5-Flash
Hugging Face
https://huggingface.co/stepfun-ai/Step-3.5-Flash
在线体验
暂无在线体验地址
Step 3.5 Flash

官方介绍与博客

官方论文
Step 3.5 Flash
DataLearnerAI博客
阶跃星辰StepFun开源激活参数只有11B的Step-3.5-Flash模型,但是评测结果和Kimi K2.5、Qwen3-Max-Thinking差不多,最高推理速度可以达到350tokens/s!
Step 3.5 Flash

API接口信息

接口速度
5/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本0.00.0
缓存计费Cache
模态输入 Cache输出 Cache
文本0.0--
超上下文计费Extended
模态输入输出
文本0.0--
Step 3.5 Flash

评测结果

Step 3.5 Flash 当前已收录的代表性评测结果包括 AIME2025(6 / 106,得分 99.80)、LiveCodeBench(11 / 118,得分 86.40)、τ²-Bench(5 / 40,得分 88.20)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
思考模式细分 (1)
全部默认 (思考模式)
工具使用
全部使用工具不使用工具

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
ARC-AGI
思考模式
53.50
42 / 65
ARC-AGI
思考模式工具
56.50
39 / 65

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
思考模式
86.40
11 / 118
SWE-bench Verified
思考模式
74.40
33 / 103

数学推理

共 4 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
思考模式
97.30
18 / 106
AIME2025
思考模式工具
99.80
6 / 106
IMO-AnswerBench
思考模式
85.40
6 / 17
IMO-AnswerBench
思考模式工具
86.70
4 / 17

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench
思考模式工具
88.20
5 / 40

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
思考模式工具
69
20 / 43

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
思考模式工具
51
29 / 43

OpenClaw智能体能力综合测评

共 2 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
思考模式工具
85.30
15 / 37
Claw Bench
思考模式工具
84.90
16 / 29
查看评测深度分析与其他模型对比
Step 3.5 Flash

发布机构

StepFunAI
StepFunAI
查看发布机构详情
Step 3.5 Flash

模型解读

StepFun Flash 3.5 是阶跃星辰(StepFun)于 2026 年 2 月最新发布的开源“轻量级”旗舰模型,专为智能体(Agent)场景与高并发应用设计。该模型在保持极低推理成本和极高响应速度的同时,具备比肩闭源大模型的逻辑推理与代码生成能力。

1. 模型简介与核心定位

  • 发布机构:阶跃星辰 (StepFunAI)
  • 发布时间:2026年2月2日
  • 核心定位:该模型被称为 Agent 时代的“轻骑兵”,旨在解决传统大模型在复杂智能体交互中“速度慢”与“成本高”的痛点。它特别优化了指令遵循与工具调用能力,适合作为各类端侧应用与云端 Agent 的核心大脑。

2. 架构与技术规格

  • 稀疏 MoE 架构:采用先进的混合专家(Mixture-of-Experts)设计,模型总参数量为 1960亿 (196B),但单次推理的激活参数量仅为 110亿 (11B)。这种设计在保证知识储备的同时,极大降低了计算负载。
  • MTP-3 加速技术:引入了“多 Token 预测”(Multi-Token Prediction)技术,一次前向传播可预测 3 个 Token,使得推理速度最高可达 350 TPS,特别适合实时交互场景。
  • 上下文窗口:原生支持 256K 超长上下文,结合滑动窗口与全局注意力机制,能够精准处理长文档分析与复杂的多轮对话历史。

3. 核心能力与支持模态

  • 模态支持:支持文本输入/输出及代码生成(Text/Code)。虽为轻量版,但继承了 Step 系列的多模态理解基因,能高效处理结构化数据。
  • 智能编程与可视化:在代码生成方面表现卓越,官方演示显示其仅凭自然语言描述即可编写并输出基于 WebGL 2.0 的高性能可视化程序。
  • 复杂逻辑推理:在不依赖外部工具的情况下,能够快速完成等差数列求和、阶乘累加等高难度数学运算,逻辑性能显著优于同尺寸竞品。

4. 性能与基准评测

  • Agent 能力:在复杂的端云协同任务中,表现出极强的任务拆解能力。例如将模糊的用户需求(如“对比全网价格”)自动拆解为具体的搜索、抓取与汇总子任务。
  • 基准对比:在数学逻辑与代码编写的基准测试中,其得分足以媲美当前主流的闭源大模型,同时保持了开源模型的高可控性。

5. 应用场景与限制

  • 推荐用例:实时对话机器人、代码辅助助手、复杂 Agent 工作流编排、端侧设备(如高配个人工作站)本地部署。
  • 部署优势:官方已针对 NVIDIA DGX 及 Apple M4 Max 等硬件进行了专门优化,降低了本地部署门槛。

6. 访问方式与许可

  • 开源许可:模型权重已在 Hugging Face 与 GitHub 上开源(Apache 2.0 协议)。
  • API 访问:已上线 OpenRouter 及阶跃星辰开放平台,发布初期提供限免或低成本调用服务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码