階躍星辰正式推出專為實時Agent工作流設計的新一代開源基座模型Step 3.5 Flash,該模型通過技術創新實現了推理速度、智能表現與使用成本的平衡。在單請求代碼生成等任務中,其最高推理速度可達每秒350個token,為開發者提供了更高效的底層模型選擇。這款被定位為"Agent開發伴侶"的模型,旨在降低大模型應用的技術門檻,推動智能體技術在更多場景的落地。
模型采用稀疏混合專家(MoE)架構,總參數規模達1960億,但每個token處理僅激活約110億參數。這種設計在保持模型性能的同時,將推理效率提升至行業領先水平。技術團隊表示,通過動態參數激活機制,模型能夠根據任務復雜度自動調配計算資源,既保證了復雜任務的處理能力,又避免了簡單任務的資源浪費。
在硬件生態建設方面,Step 3.5 Flash已與國內六家主流芯片廠商完成適配。華為昇騰、沐曦股份、壁仞科技等企業通過聯合優化,顯著提升了模型在國產算力平臺上的運行效率。這種軟硬協同的創新模式,使得模型推理成本較傳統方案降低約40%,為中小企業應用大模型提供了可行路徑。多家測試機構的數據顯示,適配后的系統在保持精度不變的情況下,能耗降低了近三分之一。
值得關注的是,階躍星辰今年早些時候聯合產業鏈伙伴發起了"模芯生態創新聯盟"。該聯盟匯聚了近十家芯片設計、制造及云計算企業,致力于打破模型開發與硬件部署之間的技術壁壘。通過建立統一的標準接口和優化工具鏈,聯盟成員共同探索大模型在金融、醫療、工業等領域的垂直應用。某參與企業負責人透露,聯盟正在制定面向Agent開發的算力評估體系,這將為行業提供重要的參考標準。
行業分析師指出,隨著大模型從訓練階段轉向推理應用,模型架構與硬件架構的深度融合將成為關鍵趨勢。Step 3.5 Flash的推出及其生態建設,恰好契合了這一發展方向。其開源策略不僅降低了技術準入門檻,更通過社區協作加速了技術迭代。目前,該模型已在代碼生成、智能客服等場景展開試點應用,部分合作企業反饋其響應速度較前代產品提升超過60%。











