春節期間,國產人工智能領域迎來一波新品發布熱潮,其中智譜科技推出的新一代大模型GLM-5成為行業焦點。這款模型不僅與備受矚目的DeepSeek V4同期亮相,更憑借技術突破引發資本市場強烈反應——公司股價在短期內實現三倍增長,總市值突破1500億港幣大關。
全球模型服務平臺OpenRouter此前上線的一款代號"Pony Alpha"的匿名模型,因在代碼生成任務中展現出與Claude Opus相當的實力而引發技術圈熱議。經過多方驗證,該模型的真實身份逐漸浮出水面:系統提示詞中自述為GLM架構,且存在與GLM家族模型相同的文本處理漏洞——當輸入"鍋內倒入植物油燒熱"這類中文烹飪指令時,模型會輸出混亂結果。這些特征與智譜即將發布的GLM-5高度吻合。
技術解析顯示,GLM-5采用與DeepSeek-V3/V3.2相同的稀疏注意力機制(DSA),總參數量達7450億,是前代GLM-4.7的兩倍規模。其創新性的多token預測架構包含78層隱藏層,通過256個專家模塊實現動態計算,每次激活8個專家模塊即可輸出約440億參數的推理結果,稀疏度控制在5.9%水平。這種設計使模型在保持高效運算的同時,上下文處理能力擴展至202K token。
值得關注的是,GLM-5在技術復用方面取得突破。通過兼容DeepSeek的稀疏架構,新模型可直接調用vLLM、SGLang等主流推理框架的優化方案,顯著降低企業級部署的技術門檻。這種技術協同效應被視為推動智譜股價飆升的關鍵因素之一——資本市場預期該模型將加速在金融、醫療等領域的商業化落地。
盡管GLM-5在文本處理領域展現強勁實力,但其多模態能力仍存提升空間。作為DeepSeek技術路線的延續者,該模型現階段主要聚焦文本生成,與當前主流大模型普遍具備的視頻處理能力形成對比。業內人士指出,隨著2026年多模態技術成為行業標配,GLM系列模型可能需要通過架構升級來彌補這一短板。
資本市場對GLM-5的熱烈反響已轉化為實際數據:智譜科技股價較數月前IPO時暴漲200%,總市值突破1500億港幣。這種增長態勢既反映投資者對國產大模型技術突破的認可,也預示著AI領域新一輪競爭格局正在形成。隨著GLM-5在全球市場的持續滲透,中國人工智能企業的技術影響力正在從亞太地區向全球范圍擴展。










