華為云與智譜今日聯合宣布,新一代開源大模型GLM-5.1正式上線華為云平臺,成為全球首個實現8小時級持續穩定運行的開源模型。該模型在真實軟件開發場景的SWE-bench Pro基準測試中,以顯著優勢超越國際知名模型Opus 4.6,創下國產模型在該領域的最佳成績。
技術層面,GLM-5.1通過深度優化昇騰算力架構,實現了Layer級MOE(混合專家模型)的絕對均衡。研發團隊創新性地采用框架能力優化技術,確保每個專家模塊均勻產出Token,同時結合昇騰Attention算子的硬件特性,通過推理框架與芯片的協同優化,顯著提升了算力分配均衡性和HBM(高帶寬內存)訪問效率。經實測,華為云平臺上的模型整體吞吐量提升達30%。
在開發者服務方面,華為云MaaS(模型即服務)平臺已開通GLM-5.1的API調用通道,提供免部署的Tokens服務支持在線體驗。企業用戶則可通過ModelArts模型訓推平臺,選擇公共算力池或專屬算力池兩種部署模式,靈活滿足不同場景下的算力需求。這種"一鍵部署"的設計大幅降低了大模型的應用門檻。
據技術白皮書披露,GLM-5.1在持續工作能力上取得突破性進展。通過動態資源調度和故障自愈機制,該模型可保持8小時以上的不間斷運行,較前代模型穩定性提升300%。這一特性使其在需要長時間推理的工業質檢、金融風控等場景中具有顯著優勢。目前,華為云已開放模型微調工具鏈,支持企業基于GLM-5.1開發定制化行業解決方案。











