AIPress.com.cn報道
國產大模型開源陣營又添一員。
2月2日,階躍星辰發布Step 3.5 Flash,定位為“為Agent而生”的開源基座模型,主打推理速度、Agent能力和長鏈條任務穩定性。
這款模型的參數總量達到1960億,但采用稀疏MoE架構,每個token僅激活約110億參數。配合MTP-3多token預測機制和3:1滑動窗口注意力架構,官方宣稱推理速度最高可達350 TPS,支持256K上下文長度。核心賣點是三個詞:更快、更強、更穩——快在推理速度,強在Agent和數學任務表現,穩在復雜長鏈條任務的可靠性。
陰影柱狀圖為 Step 3.5 Flash 開啟 Parallel Thinking 后的增強性能。左側開源模型按總參數量排序,右側為閉源模型。XBench-DeepSearch 數據源自官方發布。
部署方式上,階躍星辰這次給得很全。開發者可以通過OpenRouter限時免費調用API,也可以從GitHub和HuggingFace下載模型權重自行部署。普通用戶則可以在階躍AI的App和網頁端直接體驗。
值得注意的是本地部署的支持范圍。官方表示已專門優化本地運行性能,支持在個人工作站上流暢運行,兼容設備包括NVIDIA DGX Spark、Apple M3/M4 Max以及AMD AI Max+ 395。一個1960億參數的模型能在消費級硬件上跑起來,背后是稀疏激活架構帶來的實際計算量壓縮,110億的激活參數讓這件事成為可能。
階躍星辰還透露,Step 4模型已啟動訓練,并開放Discord社區邀請開發者參與共創。











