近日,人工智能領域迎來重要進展——階躍星辰正式開源其最新模型Step 3.5 Flash,并同步上線相關平臺。該模型在智能體場景與數學任務處理能力上已接近閉源模型水平,能夠高效完成復雜長鏈條任務,被視為階躍星辰迄今性能最強的開源基座模型。
技術架構方面,Step 3.5 Flash采用稀疏混合專家(MoE)設計,總參數量達1960億,但單個token僅需激活約110億參數。這種設計在保證模型能力的同時顯著提升了推理效率。針對長文本處理場景,該模型通過三路多Token預測技術實現每秒100-300個token的生成吞吐量,在單請求代碼類任務中峰值可達350TPS,并支持256K長度的文本理解與生成。
在性能測試中,Step 3.5 Flash展現強勁實力。數學競賽級任務方面,該模型在AIME 2025、IMOAnswerBench、HMMT 2025等測試中分別取得97.3、88.8、96.2分,開啟Parallel Thinking增強模式后性能躍居首位。編碼能力測試中,其在LiveCodeBench-V6獲得86.4分,增強模式下僅次于Gemini 3.0 Pro。智能體能力測試顯示,該模型在BrowseComp和xbench-DeepSearch測試中分別獲得69.0和54.0分,緊追行業領先水平。
實際應用測試中,該模型展現出強大的任務處理能力。面對"9.9和9.11誰大"的數學問題,模型能快速給出正確答案,僅在數值輸出時出現9.9誤寫為99.9的小誤差。在復雜計算任務中,模型可準確計算等差數列求和、立方和、階乘和等數學問題。智能體編程測試中,模型根據文字描述自動生成可調節海浪頻率的模擬平臺,并成功構建包含15000個動態節點的氣象情報儀表盤,展現出強大的地理空間可視化能力。
多智能體協作方面,Step 3.5 Flash采用分層框架設計,主智能體通過動態路由協調"搜索""驗證"等子智能體并行工作。在價格對比任務中,模型將"查詢Mac Mini M4各平臺價格"的需求拆解為淘寶、京東、拼多多三個子任務,最終精準識別出最低價平臺并提供購買建議。這種云端規劃能力顯著降低了本地執行難度,提升了數據抓取成功率。
該模型的開源已獲得產業界廣泛支持,華為昇騰、沐曦股份、壁仞科技等六家芯片廠商率先完成適配。模型可在Mac Studio M4 Max等消費級硬件上安全運行,在保證數據私密性的同時維持高性能表現。據透露,階躍星辰已啟動Step 4模型的訓練工作,持續聚焦智能體基礎模型研發。











