产业资讯

Step 3.7 Flash Agent效率实测：新时代性能对比

2026-05-29

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

Step3 7Flash 今日正式发布，作为一款开源模型，它直击Agent时代三大核心难题：效率瓶颈、可

Step3.7Flash 今日正式发布，作为一款开源模型，它直击Agent时代三大核心难题：效率瓶颈、可靠性不足与多模态执行能力欠缺。采用Apache2.0开放权重协议发布，迅速引发行业关注。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

一组关键评测数据表明，Step3.7Flash在多项基准测试中展现了强劲实力：

这些成绩背后，是它在Agent任务、代码生成、视觉搜索等复杂场景下建立起的显著竞争优势。

专为Agentic、代码、搜索及多模态工作流优化的Step3.7Flash，在推理速度与计算效能之间实现了巧妙平衡：

关键在于，维持高性能的同时，部署成本显著降低——对开发者而言，这是真正可用且高效的方案，而非“画饼充饥”。

其最大亮点是打通了从感知到行动的完整链路。模型可解析UI界面、图表、文档及图像等视觉内容，并自动编写代码或调用工具完成相应操作——核心差异在于“看懂并执行”。

增强型Web+视觉搜索能覆盖更广泛的信息源，并支持多轮深度追问。工具调用可靠性尤为突出：在τ²-bench全部难度级别上，成功率超过98%，目标漂移与调用失败等常见问题得到显著抑制。

该模型已与Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架及MCP协议深度兼容。同时支持在Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地运行——对注重隐私或需要离线部署的场景，这是关键优势。

AIbase点评：Step3.7Flash的发布标志着开源Agent模型从“可用”迈入“好用、可靠、高效”的新阶段。在Agent正成为AI核心应用范式的今天，这款在速度、成本与执行可靠性间取得平衡的模型，有望成为开发者构建下一代智能工作流的关键基石。

来源：互联网

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。