互聯網上關于神秘模型“Pony Alpha”的猜測持續發酵一周后,謎底終于揭曉——這款引發諸多討論的模型,正是智譜 AI 推出的 GLM-5,它被視作智譜 AI 在春節期間放出的“大招”,并且一登場便直接開源,這一舉措在 AI 領域引發了廣泛關注。
在測試環節,GLM-5 展現出了驚人的能力。當被要求創建一個交互式的 HTML、CSS 和 Java 衛星系統模擬程序,模擬衛星向地面接收器發送信號的過程時,它沒有立刻給出代碼,而是稍作“停頓”,模擬思考過程后,生成了一個符合要求的 HTML 網頁。在這個網頁中,衛星不僅圍繞地球運行,信號傳輸還帶有符合多普勒效應視覺隱喻的波紋擴散動畫,這表明它理解了模擬背后的物理規律,而不僅僅是完成簡單的繪圖任務。
進一步加大難度,測試人員提出了一個抽象的 Python 任務:可視化展示單行道中交通信號燈的工作原理,車輛以隨機速率進入。不到 3 分鐘,GLM-5 就生成了一個動態的交通流模擬圖。綠燈時車輛放行,紅燈時車輛排隊,車輛加速減速的隨機性也得到了很好的模擬,不過界面設計稍顯簡陋。
GLM-5 的出色表現吸引了眾多網友參與測試。網友 @anurudhsharmaa 僅用一行提示詞,就讓它生成了一個具有審美感的網站;網友 @zakarinoo7 則生成了一個全功能的媒體播放器,支持 MP4/MP3 解碼、播放列表管理,還具備深色模式 UI,編譯后僅有 15MB。
在更復雜的測試中,測試人員讓 GLM-5 打造一個火柴人開放世界游戲。它沒有急于編寫代碼,而是像人類一樣,從技術棧、核心玩法、世界風格等方面逐步對接需求。在開發過程中,測試人員不斷提出新的想法,如增加經濟系統、動作元素、背包 UI 以及與 NPC 對話功能等,GLM-5 都能一一滿足。最終運行效果令人滿意,游戲體驗盡善盡美。
GLM-5 在系統打造方面也有出色表現。有人讓它打造一個 Mac 系統,雖然整體有些粗糙,但經典的屏幕背景、頂部狀態欄的時間同步顯示以及底部 Dock 欄的圖標排列都得以呈現,而且每個應用都能打開。
基準測試結果顯示,GLM-5 在 Coding 與 Agent 能力上取得了開源領域的最優表現。在 SWE-bench-Verified 和 Terminal Bench 2.0 這兩個公認難度極高的編程榜單中,GLM-5 分別獲得了 77.8 和 56.2 的高分,在真實編程場景中的體驗已無限接近 Claude Opus 4.5。
GLM-5 之所以能取得如此優異的成績,得益于其獨特的技術架構。它采用了 MoE 架構和異步強化學習(Asynchronous RL),總參數量為 744B,激活參數僅 40B,既聰明又輕量。智譜構建的全新“Slime”框架是其關鍵所在,以往的模型訓練如同“考試”,為拿高分而背題;而 GLM-5 的訓練則像“實習”,在 Slime 環境中通過完成一個個完整的長程項目,在反饋和交互中不斷學習。它還首次集成了 DeepSeek Sparse Attention(稀疏注意力機制),在處理大量代碼上下文時不會“迷路”,還能大幅降低部署成本。
值得注意的是,在官方公告底部的致謝名單中,出現了華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等眾多國產芯片企業的名字,這幾乎涵蓋了中國半導體行業的“半壁江山”。這意味著 GLM-5 的開源不僅是軟件層面的突破,更標志著國產 AI 生態從底層芯片算力、中間框架到上層模型,逐漸形成了一個完整的閉環。











