人工智能領(lǐng)域迎來重要進(jìn)展,智譜公司正式發(fā)布并開源其最新模型GLM-5。該模型在國(guó)際權(quán)威評(píng)測(cè)平臺(tái)Artificial Analysis的榜單中表現(xiàn)亮眼,位列全球第四,同時(shí)在開源模型中排名第一,標(biāo)志著我國(guó)在智能體工程領(lǐng)域取得突破性成果。
據(jù)技術(shù)團(tuán)隊(duì)介紹,GLM-5實(shí)現(xiàn)了從代碼生成到系統(tǒng)化工程思維的跨越式發(fā)展。相較于傳統(tǒng)模型專注于代碼片段生成,新模型構(gòu)建了完整的Agentic Engineering框架,能夠深度理解復(fù)雜工程邏輯,在多步驟任務(wù)規(guī)劃、工具鏈協(xié)同等場(chǎng)景中展現(xiàn)顯著優(yōu)勢(shì)。這種進(jìn)化使得模型在處理真實(shí)開發(fā)需求時(shí)更具實(shí)用價(jià)值。
在多項(xiàng)基準(zhǔn)測(cè)試中,GLM-5展現(xiàn)出卓越性能。編程能力測(cè)試方面,該模型在SWE-bench-Verified和Terminal Bench 2.0分別取得77.8和56.2的開源模型最高分,超越Gemini 3 Pro等國(guó)際主流模型。在涉及聯(lián)網(wǎng)檢索、工具調(diào)用等綜合能力的BrowseComp、MCP-Atlas測(cè)試中,同樣占據(jù)開源模型首位。復(fù)雜場(chǎng)景測(cè)試中,τ2-Bench和Vending Bench 2的評(píng)估結(jié)果也驗(yàn)證了其領(lǐng)先地位。
國(guó)產(chǎn)化適配成為該模型的重要特色。研發(fā)團(tuán)隊(duì)與華為昇騰、摩爾線程、寒武紀(jì)等七家國(guó)內(nèi)算力供應(yīng)商展開深度合作,完成從芯片架構(gòu)到推理框架的全面優(yōu)化。這種適配能力確保模型可在不同技術(shù)路線的國(guó)產(chǎn)硬件上高效運(yùn)行,為金融、制造、能源等關(guān)鍵領(lǐng)域的自主可控應(yīng)用提供技術(shù)支撐。
技術(shù)文檔顯示,GLM-5采用混合架構(gòu)設(shè)計(jì),在保持參數(shù)規(guī)模可控的同時(shí),通過動(dòng)態(tài)注意力機(jī)制提升長(zhǎng)文本處理能力。其訓(xùn)練數(shù)據(jù)覆蓋多語言編程規(guī)范、工程文檔和實(shí)時(shí)網(wǎng)絡(luò)信息,使得模型既能生成符合編碼規(guī)范的代碼,又能理解業(yè)務(wù)場(chǎng)景中的非結(jié)構(gòu)化需求。這種設(shè)計(jì)理念有效解決了傳統(tǒng)模型"重生成輕理解"的缺陷。
開源社區(qū)對(duì)GLM-5的發(fā)布反應(yīng)熱烈。開發(fā)者指出,該模型提供的工程化接口和預(yù)訓(xùn)練模塊顯著降低了智能體開發(fā)門檻。特別是在需要多工具協(xié)同的復(fù)雜場(chǎng)景中,模型自帶的規(guī)劃執(zhí)行框架可減少60%以上的代碼量。目前已有多個(gè)開源項(xiàng)目基于GLM-5構(gòu)建自動(dòng)化運(yùn)維、智能客服等應(yīng)用原型。












