近日,人工智能領域迎來重要進展,智譜公司正式發布其最新一代基礎模型GLM-5。這款擁有744B參數(40B激活)的模型,規模達到前代GLM-4.5的兩倍以上,在Artificial Analysis全球榜單中位列第四,同時摘得開源模型桂冠。技術報告顯示,GLM-5的預訓練數據量從23T擴展至28.5T,印證了規模化仍是提升AGI效能的核心路徑。
在編程能力方面,GLM-5展現出顯著突破。該模型在SWE-bench-Verified和Terminal Bench 2.0基準測試中分別取得77.8和56.2的開源模型最高分,性能超越Gemini 3 Pro,并與Claude Opus 4.5形成直接對標。架構創新上,模型引入DeepSeek的DSA稀疏注意力機制,在保持上下文容量的同時降低30%部署成本。資本市場對此反應積極,發布當日智譜股價單日漲幅達26%,周累計漲幅近70%,市值突破1756億港幣。
實測環節驗證了GLM-5的邏輯推理能力。面對"100米距離選擇開車還是步行洗車"的經典陷阱題,模型精準指出核心矛盾:"需要清洗的是車輛而非人體",并創造性提出"駕車前往后步行返家,洗車完成后再取車"的優化方案。在處理"父母能否結婚"的模糊問題時,模型自動拆解出"未婚父母"與"已婚父母"兩種場景,準確識別出常規語境下的邏輯悖論。更令人印象深刻的是,當被問及"親生父母結婚未通知自己"的情緒困擾時,模型瞬間切換至心理咨詢模式,同時敏銳捕捉到時間維度上的根本矛盾——新生兒不可能參與父母婚禮。
開發者社區的實戰測試進一步印證模型實力。某開發者使用OpenClaw Agent進行SwiftUI編程對比,GLM-5在界面布局與交互邏輯實現上優于Minimax M2.1。另一組3D網頁開發測試中,GLM-5與Opus 4.6展現出不同設計風格,但前者在工程實現完整性上獲得更高評價。這些案例表明,模型已具備從代碼生成向系統級工程能力躍遷的潛質。
技術適配層面,GLM-5完成與華為昇騰、摩爾線程、寒武紀等七家國產算力平臺的深度優化,通過底層算子重構實現硬件加速,在國產芯片集群上達成高吞吐、低延遲的穩定運行。服務模式上,智譜調整GLM Coding Plan套餐價格,最低漲幅30%,同時開放Hugging Face和魔搭社區的模型權重下載,支持Claude Code與OpenClaw生態兼容,普通用戶可通過Z.ai平臺免費體驗。
針對專業開發場景,智譜推出Z Code智能體開發環境。該系統可自動拆解用戶需求,調度多智能體并行完成代碼編寫、命令執行、調試預覽等全流程開發,甚至支持手機端遠程操控桌面Agent。值得關注的是,Z Code平臺本身即由GLM系列模型參與構建,形成技術閉環。在文檔處理領域,GLM-5突破傳統文本生成邊界,可直接輸出Word、PDF、Excel等格式文件,在Vending Bench 2模擬經營測試中取得4432美元賬戶余額,展現出色的長期規劃能力。
技術革新背后是算法框架的突破。智譜研發的"Slime"強化學習架構支持更大規模模型訓練,配合異步智能體強化學習算法,使模型能夠從長序列交互中持續學習。這種設計顯著提升了復雜任務執行效率,在BrowseComp聯網檢索、MCP-Atlas工具調用等專項測試中均刷新開源模型紀錄。隨著工程化能力成為競爭焦點,大模型正從輔助開發工具向獨立承擔完整工程環節的方向演進。











