其他资讯阶跃Step

阶跃Step 3.7 Flash登顶AA榜 Agent变现全攻略

2026-06-07

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

6月4日，一件值得关注的事情发生了——阶跃星辰开源的Flash基座模型Step 3 7 Flash，在Artificia

6月4日，一件值得关注的事情发生了——阶跃星辰开源的Flash基座模型Step 3.7 Flash，在Artificial Analysis榜单上一口气拿下多个第一，顺便还登上了OpenRouter Trending榜全球第二。

▲Step 3.7 Flash在输出速度榜单排名第一

海外开发者社区的反应更为直观，Step 3.7 Flash几乎是用速度和性价比在刷屏。官方说它的运行速度超过400 tokens/s，但有开发者不信邪，实测后发现，在极端条件下，模型甚至能跑到6000 tokens/s。更有意思的是另一组数据：Step 3.7 Flash只用了Claude Opus 4.6大约九分之一的任务成本，就实现了其97%的性能。

坦率地说，这款模型在绝对智能水平上不算顶尖，但它走了一条更讨巧的路——在效率上做文章。

这种效率导向的优势，让Step 3.7 Flash在企业服务市场找到了一个非常舒服的位置：“实用、利于规模化落地”。原因很简单，它正好击中了当下Agent商业规模化落地的两个痛点——真实任务中跑不动，也养不起。

这就是横亘在Agent从榜单、PPT演示进入真实商用场景之间，那道绕不过去的坎。很多企业客户发现，一旦模型面临复杂任务，需要经历任务拆解、工具调用、结果校验、多次修正这一整套流程，链路过长、token无效损耗的问题马上暴露出来。而这些问题，正在成为制约Agent规模化商用的真正阻力。

这也让未来Agent商业化的分水岭变得清晰：谁能以更高性价比，让Agent在真实业务场景中响应更快、任务准确率更高，谁就拿到了打通智能体商业化闭环的钥匙。

一、智能体风口，低效痛点拖累规模化落地进程

从年初OpenClaw、Hermes接连出圈，到OpenAI联合创始人兼CEO萨姆·奥尔特曼（Sam Altman）昨晚直播时直言“全天候主动式Agent是未来一年头号布局方向”，智能体热潮已经势不可挡。

但热潮背后，落地的硬伤也越来越刺眼。居高不下的无效token损耗、低效运行问题，持续困扰着一线开发者，拖慢了他们的项目节奏。

效率方面，Cursor社区有开发者吐槽，他们在执行智能体顺序终端命令时，即便是一个10毫秒就能完成的简单指令，相邻命令之间竟然有大约27秒的冗余延迟。串行任务的效率损耗，直接飙到了99.95%。

▲开发者实测时延

密歇根大学、斯坦福大学、微软以及谷歌DeepMind等机构今年4月联合发布的研究，进一步印证了这个症结：智能体在执行任务时，需要反复灌入历史上下文，导致模型输入输出的token消耗比例高达154:1。

▲智能体执行任务时输入输出token消耗比例

成本方面也一样棘手。Agent自主多轮调用的机制，天然会放大token消耗。上月初，有开发者提到用Claude Code做代码重构时，还没正式提问，光是上下文预加载就耗掉了3.5万到4万个token。仅仅3次提示调用，就把原本够用4小时的token额度用完了。

落到企业端，成本失控会更夸张。Uber说员工大规模使用AI编程工具后，4个月就烧掉了全年的AI预算；还有家不具名的公司，因为忘记设限，一个月在Claude上就烧掉了5亿美元。

这类效率困局说明一个问题：业内评判Agent价值的逻辑已经变了。基础模型底子好只是前提，放在Agent场景里，模型只答题、单项能力强远远不够。高效、少冗余、省Token、低成本地跑完整套任务，才是检验模型能否适配智能体的硬指标。

因此，破解智能体低效困局的落脚点，自然就落在了速度和性价比两个维度上。

一方面，通过提升效率来减少Agent运行时无效等待带来的无用算力开销，让算力的每一秒都用在任务闭环上；另一方面，提升模型单次执行任务的成功率，让同等任务消耗更少的Token和更少的时间，从而拉高业务落地的性价比。

而在当下，已经实现Agent全程跑得更快、花钱更少、产出效率更高的模型，正是阶跃星辰最新开源的Step 3.7 Flash。

二、速度登顶、性价比拉满，Step 3.7 Flash释放Agent商用价值

在Agent时代，Step 3.7 Flash交出了一份差异化明显的答卷。

先看个头盘——让它生成一个体感打砖块游戏。Step 3.7 Flash生成的游戏能自动触发摄像头，人脸移动和挡板移动同步，击碎砖块时还有特效，结束时砖块会震动掉落。虽然挡板接住时可能略有延迟，但整体可玩性已经非常高了。

在模型底层基础能力拉满的前提下，Step 3.7 Flash在规模化落地能力上更进一步，这正好对应了前面提到的破解智能体低效困局的两个关键。

第一是速度。根据官方数据，Step 3.7 Flash最高生成速度可达400 tokens/s。有开发者实测显示，Step 3.7 Flash单流生成速度是DeepSeek-V4的2.4倍；64并发峰值吞吐达到DeepSeek-V4的3.47倍，高并发场景下吞吐优势尤其突出。更夸张的是，他在极端条件下甚至实现了6000 tokens/s的传输速率。

用Step 3.7 Flash做了一个番茄计时器，最终生成的应用布局简洁、核心要素齐全，而且整个生成过程只花了1分钟左右，一次成功。

值得一提的是，有开发者实测证明，在个人电脑上Step 3.7 Flash的速度也没有明显缩水。它的4bit量化版只需128GB Apple Silicon设备就能满载32K上下文，在Mac Studio环境下基准测试生成速度超过53 tokens/s。

根据Artificial Analysis的数据，Step 3.7 Flash的表现已经接近Agent商业化落地的最优区间——既能兼顾高智能，又能实现超高速率。

第二是高性价比。Step 3.7 Flash在综合推理、输入上下文、工具调用、Agent多轮交互等全场景后的综合单价，是每百万token 0.2美元（约合1.35元软妹币）。这个价格和之前官宣永久降价的DeepSeek、小米MiMo持平，均位列榜单第一。

▲Step 3.7 Flash价格最低

从Artificial Analysis的速度价格比分布来看，Step 3.7 Flash在兼具高速和低成本方面的综合实力，已经让它具备了很强的Agent商业化竞争力。

综合来看，Step 3.7 Flash在性能拉满的同时，从速度和成本两个方向实现了突破。一方面，它凭借领先竞品的单流推理速度和高并发吞吐能力，精简了任务循环中的损耗；另一方面，它显著压低了个体和中小开发者的使用成本，进一步为智能体规模化落地扫清了障碍。

三、综合性能跻身全球头部，阶跃已跑通Agent商业化

当前AI行业正式进入了商业化深度竞速阶段。模型在推理速率、综合性能与落地成本之间实现均衡突破，已经成为规模化商用落地的核心评判标准。

从这个角度看，阶跃星辰的模型迭代路径——从Step 3.5 Flash到Step 3.7 Flash——一脉相承。它们围绕Agent、Coding、Search与多模态工作流进行系统优化，核心目标只有一个：让Agent在真实场景中高效运行。

全球开发者市场的真实数据也验证了这一点。两代模型发布仅两天，就先后登上了OpenRouter榜单的头部：Step 3.5 Flash登顶首位，Step 3.7 Flash则拿下了全球第二。

不仅如此，阶跃星辰在推理效率上也已经进入全球头部阵营。开源团队Dirac基于OpenRouter数据统计了当下主流模型的缓存命中率，其中达到S级缓存命中率的模型，清一色都是国产模型。这意味着国产模型的实力正在快速追上来。

阶跃星辰更是以86.1%的得分位列全球第二。这么高的缓存命中率，正是模型推理更快、损耗更低、稳定运行的核心原因。

这都证明，阶跃星辰的高效率、轻量化Flash系列模型，已经具备了承接真实Agent落地任务的能力。

上个月，Step 3.5 Flash就已经完成了车载场景的规模化落地。它被用在极氪8X上，构建了整车智能体“超级Eva”的量产交互，打通了车辆感知、语义理解、指令执行的整个链路。

从模型亮眼的榜单数据，到真实场景的批量商用落地，阶跃星辰的产业化路径已经清晰可见地跑通了。

结语：轻量化Flash模型，或引爆智能体规模化落地

阶跃星辰的Flash模型，在一定程度上解决了智能体token冗余、算力浪费、链路延迟、成本高企这些低效痛点，为Agent商业化落地打通了瓶颈。

可以明确的是，随着企业级自动化、智能化需求的持续爆发，轻量化、高效率、高性价比的Flash基座模型，或许正是推动AI智能体产业规模化、商业化进阶的核心驱动力，加速智能体迈入高效落地、普惠商用的全新阶段。

来源：互联网

上一篇 AI音乐创业融资27亿，估值366亿创纪录 下一篇 OpenAI神秘AI硬件年底亮相高管评体验难以抗拒

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

阶跃Step 3.7 Flash登顶AA榜 Agent变现全攻略

摘要

一、智能体风口，低效痛点拖累规模化落地进程

二、速度登顶、性价比拉满，Step 3.7 Flash释放Agent商用价值

三、综合性能跻身全球头部，阶跃已跑通Agent商业化

结语：轻量化Flash模型，或引爆智能体规模化落地

相关文章推荐