阶跃星辰发布最强开源基座模型Step 3.5 Flash,性能领跑业界

读懂AI2天前更新 wuaiai
121 00

模型发布背景
随着大模型从“对话能力”迈向“智能体能力”,实时推理、低延迟与可控成本成为Agent工作流中的核心诉求。在这一背景下,阶跃星辰正式发布新一代开源Agent基座模型Step 3.5 Flash,面向高频、实时的Agent应用场景进行系统化优化,力图在速度、能力与成本之间取得新的平衡。

核心定位与应用方向
Step 3.5 Flash并非追求单一维度的极限指标,而是聚焦真实Agent工作流中对稳定性和响应效率的综合要求。官方数据显示,在单请求代码类任务中,该模型最高推理速度可达每秒350个token,为需要快速决策与即时反馈的Agent系统提供了更具实用价值的底层模型选择。

架构设计与效率突破
在技术架构上,Step 3.5 Flash采用稀疏MoE设计,总参数规模达1960亿,但在推理过程中,每个token仅激活约110亿参数。这一设计在保证模型智能水平的同时,大幅降低了单次推理的计算开销,使模型在高并发、低延迟场景下依然具备良好表现,为Agent类应用提供了更可负担的算力方案。

算力生态的协同推进
模型效率的提升并非单点突破,而是建立在模型与算力深度协同的基础之上。目前,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯以及阿里平头哥在内的多家芯片厂商,已完成对Step 3.5 Flash的适配。通过底层联合优化,模型在多种国产算力平台上的运行效率得到进一步释放。

产业协作与应用落地
公开资料显示,阶跃星辰早在2025年7月便联合近10家芯片与基础设施厂商,发起“模芯生态创新联盟”,意在打通模型、芯片与平台之间的技术壁垒。通过系统级协作,提升算力利用率,降低企业和开发者在部署大模型Agent时的综合门槛,加快模型在实际业务场景中的规模化应用。

行业趋势与长期意义
业内普遍认为,随着推理模型逐步成为主流,大模型的竞争焦点正在从参数规模转向“模型—算力—应用”的整体效率。Step 3.5 Flash的发布,正是这一趋势下的阶段性成果,也为Agent生态提供了一个“更快、更稳、更易用”的基础选项。

© 版权声明

相关文章