智譜近日正式推出其新一代旗艦大模型GLM-5,這款模型在復雜系統(tǒng)工程和長程Agent任務處理方面展現出卓越能力,尤其在代碼生成與Agent應用領域達到開源領域頂尖水平,實際編程體驗已接近國際領先模型Claude Opus 4.5。該模型的發(fā)布標志著國產大模型在技術突破與場景落地方面邁出關鍵一步。
作為國內首個完成GLM-5全棧適配的云服務平臺,百度智能云在模型發(fā)布當日即實現底層硬件到上層服務的無縫對接。通過百度百舸AI異構計算平臺與昆侖芯的深度協同,企業(yè)用戶可快速完成模型部署,并借助云端算力充分釋放GLM-5的性能優(yōu)勢。目前,開發(fā)者已能通過百度千帆平臺直接調用該模型,加速業(yè)務創(chuàng)新與場景落地。
在技術適配層面,百度百舸團隊與智譜研發(fā)團隊展開聯合攻關,針對GLM-5的模型架構與推理特性進行專項優(yōu)化。通過底層算子重構與工具鏈升級,團隊在模型上線前完成全鏈路性能調優(yōu),確保發(fā)布即達到穩(wěn)定高效的運行狀態(tài)。該適配方案同時支持vLLM、SGLang兩大主流開源推理框架,為不同技術路線的開發(fā)者提供靈活選擇。
算力優(yōu)化方面,百度混合云基于昆侖芯高性能計算單元,完成GLM-5的DSA架構與MoE混合專家模型適配。通過INT8量化壓縮、MTP多線程并行及雙機PP流水線等創(chuàng)新技術,模型在昆侖芯集群上的推理吞吐量實現顯著提升。這種軟硬協同的優(yōu)化模式,為國產大模型規(guī)模化應用提供了可復制的技術路徑。
截至目前,百度百舸平臺已在昆侖芯XPU上完成GLM、DeepSeek、Qwen等主流大模型的規(guī)模化部署。2025年2月,國內首個自研萬卡AI集群——昆侖芯P800集群在百度智能云成功點亮,隨后于4月擴展至3.2萬卡規(guī)模。這些基礎設施的持續(xù)升級,為國產大模型訓練與推理提供了堅實的算力保障。
這場技術協同的背后,折射出國產AI生態(tài)的進化邏輯:通過芯片廠商、云服務提供商與模型研發(fā)方的深度協作,構建從底層算力到上層應用的完整閉環(huán)。百度智能云的全棧能力建設,不僅降低了企業(yè)應用大模型的技術門檻,更為AI技術與實體經濟的深度融合創(chuàng)造了條件。隨著更多生態(tài)伙伴加入,國產大模型正在形成開放共贏的創(chuàng)新生態(tài)。











