2 月 12 日消息,2 月 11 日,智譜正式發(fā)布新一代大模型 GLM-5。摩爾線程基于 SGLang 推理框架,在旗艦級 AI 訓(xùn)推一體全功能 GPU MTT S5000 上,Day-0 完成了全流程適配與驗(yàn)證。
據(jù)介紹,憑借 MUSA 架構(gòu)廣泛的算子覆蓋與強(qiáng)大的生態(tài)兼容能力,摩爾線程成功打通了模型推理全鏈路,并深度釋放 MTT S5000 的原生 FP8 加速能力,在確保模型精度的同時顯著降低了顯存占用,實(shí)現(xiàn)了 GLM-5 的高性能推理。
作為 GLM 系列的最新里程碑版本,GLM-5 定位為當(dāng)下頂尖的 Coding 模型,整體性能較上一代提升 20%。其核心突破在于 Agentic Engineering(代理工程)能力 —— 不僅具備深厚的代碼功底,更擁有處理復(fù)雜系統(tǒng)工程與長程 Agent 任務(wù)的實(shí)力,能夠?qū)崿F(xiàn)從需求到應(yīng)用的端到端開發(fā)。
MTT S5000 是專為大模型訓(xùn)練、推理及高性能計算而設(shè)計的全功能 GPU 智算卡,基于第四代 MUSA 架構(gòu)“平湖”打造。其單卡 AI 算力最高可達(dá) 1000 TFLOPS,配備 80GB 顯存,顯存帶寬達(dá)到 1.6TB/s,卡間互聯(lián)帶寬為 784GB/s,完整支持從 FP8 到 FP64 的全精度計算。











