國產大模型領域迎來里程碑式突破。智譜公司最新發布的GLM-5.1模型在代碼生成與長程任務處理能力上實現重大跨越,不僅成為全球開源模型中的性能標桿,更在核心工程指標上達到國際頂尖閉源模型水平。該模型在發布當日同步調整服務價格,漲幅達10%,標志著國產大模型開始建立技術溢價能力。
在權威評測體系SWE-Bench Pro中,GLM-5.1以顯著優勢超越GPT-5.4和Claude Opus 4.6,刷新全球最佳成績。該測試要求模型在真實GitHub倉庫中定位并修復復雜工程漏洞,直接反映模型處理實際軟件開發任務的能力。與此同時,在Terminal-Bench 2.0和NL2Repo等專項評測中,GLM-5.1同樣展現強勁實力,三項綜合評分位列全球第三、國產第一、開源第一。
技術突破帶來商業模式革新。提價后的GLM-5.1在編程場景的緩存命中Token定價已接近Anthropic旗下Claude Sonnet4.6,這是國產大模型首次在核心應用場景實現國際價格對標。值得關注的是,就在一年前,國內廠商還在通過90%以上的價格折扣爭奪市場份額,如今已具備技術定價權。
該模型最引人注目的創新在于長程任務處理能力。區別于傳統分鐘級交互模型,GLM-5.1可獨立完成持續8小時以上的復雜工程任務,在任務執行過程中自主規劃工作流程、動態調整執行策略,最終交付符合工程標準的完整成果。這種能力突破使AI從輔助工具升級為獨立項目執行者,對軟件工程生產關系產生深遠影響。
資本市場對此反應積極。模型發布當日,智譜股價單日漲幅達13.99%,收盤價報888港元/股,公司市值突破3959億港元。行業分析師指出,當AI大模型從提供碎片化答案轉向交付完整項目解決方案,其價值創造維度發生質變,這將重構包括高性能計算、企業服務在內的萬億級市場格局。
此次技術突破標志著中國開源AI在工程化能力上實現質的飛躍。GLM-5.1的成功證明,國產大模型不僅能在特定場景達到國際領先水平,更具備重構產業價值鏈的技術實力。隨著AI從功能替代向流程再造演進,軟件工程領域或將迎來新一輪生產力革命。











