摩爾線程近日宣布,其旗艦級AI訓(xùn)推一體全功能GPU MTT S5000已成功完成對智譜新一代大模型GLM-5的全流程適配與驗證。這一成果基于SGLang推理框架實現(xiàn),標(biāo)志著國產(chǎn)GPU在高性能AI計算領(lǐng)域取得重要突破。
MTT S5000作為專為大模型訓(xùn)練與推理設(shè)計的智算卡,采用第四代MUSA架構(gòu)"平湖",單卡AI算力最高可達1000 TFLOPS,配備80GB顯存及1.6TB/s顯存帶寬。該設(shè)備完整支持從FP8到FP64的全精度計算,卡間互聯(lián)帶寬達784GB/s,為GLM-5的部署提供了堅實的硬件基礎(chǔ)。
通過MUSA架構(gòu)的廣泛算子覆蓋與生態(tài)兼容能力,摩爾線程團隊成功打通了模型推理全鏈路。特別值得注意的是,MTT S5000的原生FP8加速能力得到深度釋放,在保持模型精度的前提下,顯存占用顯著降低,為GLM-5的高性能推理提供了關(guān)鍵技術(shù)支撐。
作為GLM系列的最新成果,GLM-5定位為頂尖Coding模型,其整體性能較前代提升20%。該模型的核心優(yōu)勢在于Agentic Engineering能力,不僅具備深厚的代碼生成功底,更能處理復(fù)雜系統(tǒng)工程和長程Agent任務(wù),實現(xiàn)從需求分析到應(yīng)用部署的端到端開發(fā)流程。
此次適配驗證表明,MTT S5000可充分滿足大模型推理的嚴苛要求。其硬件架構(gòu)與GLM-5的軟件特性形成完美配合,為金融、科研、智能制造等領(lǐng)域的高性能AI應(yīng)用提供了新的解決方案。隨著國產(chǎn)GPU生態(tài)的持續(xù)完善,此類技術(shù)突破將推動AI計算向更高效、更經(jīng)濟的方向發(fā)展。











