Step 3.5 Flash

Name: Step 3.5 Flash
Availability: InStock
Author: StepFunAI

聊天大模型

Step 3.5 Flash

发布时间: 2026-02-02更新于: 2026-03-08 21:06:202,745

在线体验GitHub Hugging Face Compare

模型参数

1960亿

上下文长度

256K

中文支持

支持

推理能力

Step 3.5 Flash 是由 StepFunAI 发布的 AI 模型，发布时间为 2026-02-02，定位为聊天大模型，参数规模约为 1960.0B，上下文长度为 256K，模型文件大小约 399GB，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Step 3.5 Flash

模型基本信息

推理过程

支持

思考模式

常规模式

上下文长度

256K tokens

最大输出长度

16384 tokens

模型类型

聊天大模型

发布时间

2026-02-02

模型文件大小

399GB

MoE架构

是

总参数 / 激活参数

1960 亿 / 110 亿

知识截止

暂无数据

Step 3.5 Flash

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/stepfun-ai/Step-3.5-Flash

Hugging Face

https://huggingface.co/stepfun-ai/Step-3.5-Flash

在线体验

暂无在线体验地址

Step 3.5 Flash

官方介绍与博客

官方论文

Step 3.5 Flash

DataLearnerAI博客

阶跃星辰StepFun开源激活参数只有11B的Step-3.5-Flash模型，但是评测结果和Kimi K2.5、Qwen3-Max-Thinking差不多，最高推理速度可以达到350tokens/s！

Step 3.5 Flash

API接口信息

接口速度

5/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	0.0	0.0

缓存计费Cache

模态	输入 Cache	输出 Cache
文本	0.0	--

超上下文计费Extended

模态	输入	输出
文本	0.0	--

Step 3.5 Flash

评测结果

Step 3.5 Flash 当前已收录的代表性评测结果包括 AIME2025（6 / 106，得分 99.80）、LiveCodeBench（11 / 118，得分 86.40）、τ²-Bench（5 / 40，得分 88.20）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

ARC-AGI

思考模式

53.50

42 / 65

ARC-AGI

思考模式工具

56.50

39 / 65

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

思考模式

86.40

11 / 118

SWE-bench Verified

思考模式

74.40

33 / 103

数学推理

共 4 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

思考模式

97.30

18 / 106

AIME2025

思考模式工具

99.80

6 / 106

IMO-AnswerBench

思考模式

85.40

6 / 17

IMO-AnswerBench

思考模式工具

86.70

4 / 17

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench

思考模式工具

88.20

5 / 40

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

思考模式工具

20 / 43

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

思考模式工具

29 / 43

OpenClaw智能体能力综合测评

共 2 项评测

评测名称 / 模式

得分

排名/总数

Pinch Bench

思考模式工具

85.30

15 / 37

Claw Bench

思考模式工具

84.90

16 / 29

查看评测深度分析与其他模型对比

Step 3.5 Flash

发布机构

StepFunAI

查看发布机构详情

Step 3.5 Flash

模型解读

StepFun Flash 3.5 是阶跃星辰（StepFun）于 2026 年 2 月最新发布的开源“轻量级”旗舰模型，专为智能体（Agent）场景与高并发应用设计。该模型在保持极低推理成本和极高响应速度的同时，具备比肩闭源大模型的逻辑推理与代码生成能力。

1. 模型简介与核心定位

发布机构：阶跃星辰 (StepFunAI)
发布时间：2026年2月2日
核心定位：该模型被称为 Agent 时代的“轻骑兵”，旨在解决传统大模型在复杂智能体交互中“速度慢”与“成本高”的痛点。它特别优化了指令遵循与工具调用能力，适合作为各类端侧应用与云端 Agent 的核心大脑。

2. 架构与技术规格

稀疏 MoE 架构：采用先进的混合专家（Mixture-of-Experts）设计，模型总参数量为 1960亿 (196B)，但单次推理的激活参数量仅为 110亿 (11B)。这种设计在保证知识储备的同时，极大降低了计算负载。
MTP-3 加速技术：引入了“多 Token 预测”（Multi-Token Prediction）技术，一次前向传播可预测 3 个 Token，使得推理速度最高可达 350 TPS，特别适合实时交互场景。
上下文窗口：原生支持 256K 超长上下文，结合滑动窗口与全局注意力机制，能够精准处理长文档分析与复杂的多轮对话历史。

3. 核心能力与支持模态

模态支持：支持文本输入/输出及代码生成（Text/Code）。虽为轻量版，但继承了 Step 系列的多模态理解基因，能高效处理结构化数据。
智能编程与可视化：在代码生成方面表现卓越，官方演示显示其仅凭自然语言描述即可编写并输出基于 WebGL 2.0 的高性能可视化程序。
复杂逻辑推理：在不依赖外部工具的情况下，能够快速完成等差数列求和、阶乘累加等高难度数学运算，逻辑性能显著优于同尺寸竞品。

4. 性能与基准评测

Agent 能力：在复杂的端云协同任务中，表现出极强的任务拆解能力。例如将模糊的用户需求（如“对比全网价格”）自动拆解为具体的搜索、抓取与汇总子任务。
基准对比：在数学逻辑与代码编写的基准测试中，其得分足以媲美当前主流的闭源大模型，同时保持了开源模型的高可控性。

5. 应用场景与限制

推荐用例：实时对话机器人、代码辅助助手、复杂 Agent 工作流编排、端侧设备（如高配个人工作站）本地部署。
部署优势：官方已针对 NVIDIA DGX 及 Apple M4 Max 等硬件进行了专门优化，降低了本地部署门槛。

6. 访问方式与许可

开源许可：模型权重已在 Hugging Face 与 GitHub 上开源（Apache 2.0 协议）。
API 访问：已上线 OpenRouter 及阶跃星辰开放平台，发布初期提供限免或低成本调用服务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

模态

输入

输出

文本

0.0

模态

输入 Cache

输出 Cache

文本

0.0

模态

输入

输出

文本

0.0