环球体育登录入口 阶跃星辰开源Step 3.7 Flash大模子 ,鼓舞Agent向企业出产级演进

5月29日,基础大模子创业公司阶跃星辰认真发布并开源Step 3.7 Flash模子。这款面向出产级Agent场景谋划的Flash模子,弃取稀少搀和民众架构,总参数为1960亿,配备18.8亿参数的视觉编码器ViT,激活参数仅为110亿,最高生成速率可达每秒400个Token。
模子维持25.6万Token凹凸文长度,提供三种推理层级,主要面向高频、多轮、低延长的智能体欺诈场景。
与本年2月开源的Step 3.5 Flash比较,3.7版块在Agent才智上进行了系统性强化。模子要点优化了四个关节才智:原生多模态麇集与引申、联网与视觉搜索增强、高可靠器具调用与编排以及Agent生态兼容性。
Step 3.7 Flash概略奏凯处罚UI界面、图表、文档、图片以及万般欺诈界面,将复杂视觉信息更正为结构化效果和可引申任务,并在信息概略情时主动发起搜索进行交叉考据。器具调用方面,模子可在长程多轮责任流中褂讪调用API、浏览器、终局、Office等外部系统。
基准测试方面,Step 3.7 Flash在ClawEval 1.1自主任务引申评测中得分67.1%,在检会多器具协同的Toolathlon上得分49.5%,在横跨44种劳动的GDPval上得分45.8%,在τ²-bench Telecom全难度通讯任务测试中通过率均跳动98%。
在代码与工程才智上,模子在SimpleVQA Search视觉问答任务中得分79.2%,在V* Python视觉编程任务中得分95.3%,在SWE-Bench Pro软件工程评测中得分56.3%,位列民众第二。
需翔实的是,这些数据均由阶跃星辰官方浮现,尚未过程安定第三方机构横向考据。
开源生态方面,Step 3.7 Flash弃取Apache 2.0开源左券,环球体育官网登录入口已在Hugging Face和ModelScope平台上线,权重和代码均可奏凯下载。
模子对Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流开拓框架和器具调用左券进行了兼容优化,同期维持云表与腹地部署。
在硬件适配层面,该模子可在Mac Studio M4 Max、DGX Spark以及AMD AI Max+395等腹地建立上启动。
现时开源大模子领域竞争样貌已较为强烈。2026年4月,DeepSeek发布了V4系列,包含旗舰版V4-Pro与轻量版V4-Flash,总参数鉴识达到1.6万亿和2840亿,均维持百万Token凹凸文,弃取MIT开源左券。
2月,阿里开源了Qwen3.5-Plus,总参数3970亿,激活170亿参数,部署显存占用较前代缩小60%。4月,腾讯混元发布Hy3 preview并同步开源,同期还有月之暗面Kimi K2.6和智谱GLM-5.1接踵发布。
Step 3.7 Flash在参数领域上处于竞品序列的中等水平,其中枢互异在于明确聚焦Agent场景的工程化优化而非纯参数竞赛。模子在器具调用和任务引申方面的针对性谋划,使其在特定Agent责任流中具备互异化竞争力,但在通用推理才智和极致性能上尚需更多第三方评检修证。
2026在线买世界杯中国区平台从行业趋势看,国产大模子开源已造成密集迭代态势。浪漫2025年12月,国产开源大模平民众累计下载量冲突100亿次。斯坦福大学2026年3月发布的AI指数敷陈败露,先进闭源模子的举座阐扬仅比顶尖开源模子率先3.3个百分点。
OpenRouter平台的用户数据败露,Step 3.5 Flash上线一个月后曾登顶该平台OpenClaw调用量月榜民众第一,确认市集对高效Agent模子存在信得过需求。
Step 3.7 Flash能否继续这一趋势,将取决于其在内容部署中的褂讪性、社区罗致速率以及后续第三方安定评测的反应。
