人工智能領(lǐng)域迎來(lái)重要突破,一款名為GLM-5的新型基礎(chǔ)模型正式發(fā)布。這款模型通過(guò)引入創(chuàng)新的稀疏注意力機(jī)制和異步強(qiáng)化學(xué)習(xí)框架,在編程、推理和智能體能力方面實(shí)現(xiàn)了顯著提升,標(biāo)志著人工智能開(kāi)發(fā)范式從"氛圍編程"向"智能體工程"的重大轉(zhuǎn)變。
GLM-5在技術(shù)架構(gòu)上進(jìn)行了全面革新。研發(fā)團(tuán)隊(duì)開(kāi)發(fā)的DeepSeek Sparse Attention(DSA)機(jī)制,通過(guò)動(dòng)態(tài)選擇重要token進(jìn)行注意力計(jì)算,在保持長(zhǎng)上下文處理能力的同時(shí),將計(jì)算成本降低了近50%。模型參數(shù)規(guī)模擴(kuò)展至7440億,訓(xùn)練數(shù)據(jù)量達(dá)到28.5萬(wàn)億token,創(chuàng)下開(kāi)源模型新紀(jì)錄。針對(duì)智能體任務(wù)特點(diǎn),團(tuán)隊(duì)構(gòu)建了全新的異步強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施,將生成過(guò)程與訓(xùn)練過(guò)程解耦,使后訓(xùn)練迭代效率提升3倍以上。
在基準(zhǔn)測(cè)試中,GLM-5展現(xiàn)出卓越性能。在Artificial Analysis Intelligence Index v4.0評(píng)測(cè)中取得50分,成為首個(gè)達(dá)到該分?jǐn)?shù)的開(kāi)源模型。在LMArena平臺(tái)的文本和代碼競(jìng)技場(chǎng)中均位列開(kāi)源模型首位,整體表現(xiàn)與Claude Opus 4.5等頂尖閉源模型相當(dāng)。特別在處理真實(shí)軟件工程任務(wù)時(shí),GLM-5在SWE-bench Verified等基準(zhǔn)上超越所有開(kāi)源基線,接近閉源模型水平。
智能體能力是GLM-5的核心突破。通過(guò)提出的異步Agent強(qiáng)化學(xué)習(xí)算法,模型在長(zhǎng)周期任務(wù)中的表現(xiàn)得到質(zhì)的提升。在模擬經(jīng)營(yíng)自動(dòng)售貨機(jī)的Vending-Bench 2測(cè)試中,GLM-5獲得4432美元的最終賬戶余額,逼近Claude Opus 4.5的表現(xiàn)。新開(kāi)發(fā)的上下文管理策略使模型在BrowseComp基準(zhǔn)上的準(zhǔn)確率提升至75.9%,超越所有配備上下文管理的開(kāi)源模型。
研發(fā)團(tuán)隊(duì)構(gòu)建了全面的評(píng)估體系驗(yàn)證模型實(shí)用性。CC-Bench-V2基準(zhǔn)測(cè)試顯示,GLM-5在前端開(kāi)發(fā)任務(wù)中達(dá)到98.0%的構(gòu)建成功率,檢查項(xiàng)成功率與Claude Opus 4.5相當(dāng);在后端開(kāi)發(fā)任務(wù)中,Pass@1指標(biāo)與Claude Opus 4.5持平;在長(zhǎng)程任務(wù)評(píng)估中,代碼庫(kù)探索能力顯著優(yōu)于對(duì)比模型。這些結(jié)果證明GLM-5能夠穩(wěn)定處理真實(shí)開(kāi)發(fā)場(chǎng)景中的復(fù)雜工作流。
GLM-5的另一個(gè)重要特性是全面適配國(guó)產(chǎn)算力生態(tài)。通過(guò)與國(guó)內(nèi)主流芯片廠商深度合作,模型原生支持華為昇騰、摩爾線程、海光等七大硬件平臺(tái)。針對(duì)國(guó)產(chǎn)芯片特點(diǎn)優(yōu)化的量化策略和算子融合技術(shù),使單臺(tái)國(guó)產(chǎn)服務(wù)器即可部署7500億參數(shù)模型,長(zhǎng)序列處理成本降低50%,性能達(dá)到國(guó)際主流GPU集群水平。
在真實(shí)場(chǎng)景通用能力評(píng)估中,GLM-5在機(jī)器翻譯、多語(yǔ)言對(duì)話、指令遵循等五個(gè)維度均實(shí)現(xiàn)提升。內(nèi)部測(cè)試顯示,模型在中文到小語(yǔ)種翻譯、復(fù)雜指令理解等任務(wù)上的表現(xiàn)優(yōu)于前代版本。特別在工具調(diào)用能力方面,通過(guò)分析生產(chǎn)環(huán)境中的失敗案例構(gòu)建的專項(xiàng)基準(zhǔn)測(cè)試顯示,GLM-5的工具選擇準(zhǔn)確率和參數(shù)正確率均有顯著提高。











