智譜最新發(fā)布的基礎(chǔ)模型GLM-5在技術(shù)圈掀起熱議,這款被冠以“大模型第一股”之稱的成果,憑借其顯著提升的性能表現(xiàn),成為行業(yè)焦點(diǎn)。其核心突破——異步智能體強(qiáng)化學(xué)習(xí)算法,被視為支撐模型在真實(shí)編程場(chǎng)景中脫穎而出的關(guān)鍵技術(shù),引發(fā)開發(fā)者與科研人員的廣泛關(guān)注。
作為下一代基礎(chǔ)模型,GLM-5的定位是推動(dòng)編程范式從“氛圍編程”向“智能體工程”轉(zhuǎn)型。據(jù)研發(fā)團(tuán)隊(duì)介紹,模型性能的躍升主要依賴四大技術(shù)創(chuàng)新:首先是DSA稀疏注意力機(jī)制的引入,這一架構(gòu)通過動(dòng)態(tài)分配注意力資源,在保持長(zhǎng)文本理解與深度推理能力的同時(shí),將訓(xùn)練與推理成本大幅降低,使模型參數(shù)規(guī)模擴(kuò)展至7440億,訓(xùn)練數(shù)據(jù)量提升至28.5萬億級(jí)別。
第二項(xiàng)創(chuàng)新在于構(gòu)建異步強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施。基于前代模型“訓(xùn)練與推理解耦”的設(shè)計(jì)理念,新系統(tǒng)進(jìn)一步實(shí)現(xiàn)“生成與訓(xùn)練”的深度分離,通過優(yōu)化GPU利用率,支持大規(guī)模智能體軌跡探索。這一改進(jìn)有效解決了同步流程中的效率瓶頸,使強(qiáng)化學(xué)習(xí)后訓(xùn)練階段的迭代速度實(shí)現(xiàn)質(zhì)的飛躍。
在算法層面,GLM-5提出異步智能體強(qiáng)化學(xué)習(xí)框架,突破了傳統(tǒng)依賴迭代自蒸餾與結(jié)果監(jiān)督的訓(xùn)練模式。新算法通過長(zhǎng)周期動(dòng)態(tài)交互持續(xù)學(xué)習(xí),重點(diǎn)優(yōu)化了模型在復(fù)雜環(huán)境中的規(guī)劃能力與自我糾錯(cuò)機(jī)制,顯著提升了自主決策質(zhì)量。這一改進(jìn)被視為模型智能體能力提升的核心驅(qū)動(dòng)力。
國產(chǎn)化適配是GLM-5的另一大亮點(diǎn)。該模型從研發(fā)階段即深度整合中國GPU生態(tài),完成從底層內(nèi)核到推理框架的全面優(yōu)化,目前已兼容華為昇騰、摩爾線程、海光等七大主流國產(chǎn)芯片平臺(tái)。這一布局不僅降低了技術(shù)依賴風(fēng)險(xiǎn),也為國內(nèi)算力生態(tài)的完善提供了實(shí)踐樣本。
資本市場(chǎng)對(duì)GLM-5的發(fā)布反應(yīng)熱烈。自模型以“Pony Alpha”代號(hào)在OpenRouter平臺(tái)匿名上線后,相關(guān)企業(yè)股價(jià)持續(xù)攀升,較發(fā)布前實(shí)現(xiàn)翻倍增長(zhǎng),最高觸及725港元/股。這一表現(xiàn)反映出投資者對(duì)模型技術(shù)實(shí)力與商業(yè)化前景的高度認(rèn)可。
開源社區(qū)同樣對(duì)GLM-5報(bào)以熱情。硅谷風(fēng)投機(jī)構(gòu)a16z的對(duì)比數(shù)據(jù)顯示,該模型與全球頂尖閉源模型Claude Opus 4.6的能力差距正在快速縮小,這一結(jié)論進(jìn)一步提振了開源陣營的信心。作為完全開源的模型,GLM-5的技術(shù)細(xì)節(jié)公開后,被開發(fā)者譽(yù)為“打破技術(shù)壁壘的重要里程碑”。
研發(fā)團(tuán)隊(duì)在技術(shù)報(bào)告中強(qiáng)調(diào),GLM-5的突破性進(jìn)展是對(duì)外界質(zhì)疑的有力回應(yīng),但開源模型追趕閉源模型的競(jìng)賽遠(yuǎn)未結(jié)束。公司表示將持續(xù)探索技術(shù)邊界,構(gòu)建更高效的底層系統(tǒng),為人工智能領(lǐng)域注入持續(xù)創(chuàng)新動(dòng)能。






