阶跃星辰发布最强开源基座模型Step 3.5 Flash，性能领跑业界

模型发布背景
随着大模型从“对话能力”迈向“智能体能力”，实时推理、低延迟与可控成本成为Agent工作流中的核心诉求。在这一背景下，阶跃星辰正式发布新一代开源Agent基座模型Step 3.5 Flash，面向高频、实时的Agent应用场景进行系统化优化，力图在速度、能力与成本之间取得新的平衡。

核心定位与应用方向
Step 3.5 Flash并非追求单一维度的极限指标，而是聚焦真实Agent工作流中对稳定性和响应效率的综合要求。官方数据显示，在单请求代码类任务中，该模型最高推理速度可达每秒350个token，为需要快速决策与即时反馈的Agent系统提供了更具实用价值的底层模型选择。

架构设计与效率突破
在技术架构上，Step 3.5 Flash采用稀疏MoE设计，总参数规模达1960亿，但在推理过程中，每个token仅激活约110亿参数。这一设计在保证模型智能水平的同时，大幅降低了单次推理的计算开销，使模型在高并发、低延迟场景下依然具备良好表现，为Agent类应用提供了更可负担的算力方案。

算力生态的协同推进
模型效率的提升并非单点突破，而是建立在模型与算力深度协同的基础之上。目前，包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯以及阿里平头哥在内的多家芯片厂商，已完成对Step 3.5 Flash的适配。通过底层联合优化，模型在多种国产算力平台上的运行效率得到进一步释放。

产业协作与应用落地
公开资料显示，阶跃星辰早在2025年7月便联合近10家芯片与基础设施厂商，发起“模芯生态创新联盟”，意在打通模型、芯片与平台之间的技术壁垒。通过系统级协作，提升算力利用率，降低企业和开发者在部署大模型Agent时的综合门槛，加快模型在实际业务场景中的规模化应用。

行业趋势与长期意义
业内普遍认为，随着推理模型逐步成为主流，大模型的竞争焦点正在从参数规模转向“模型—算力—应用”的整体效率。Step 3.5 Flash的发布，正是这一趋势下的阶段性成果，也为Agent生态提供了一个“更快、更稳、更易用”的基础选项。