中金在最新發布的研報中指出,全球大模型技術將在2025年持續突破生產力場景,在推理能力、編程效率、Agentic自主性以及多模態交互等領域取得顯著進展。然而,當前模型在通用能力上仍存在穩定性不足、幻覺率偏高等短板,距離真正實現通用人工智能(AGI)仍有較大差距。報告預測,2026年將成為大模型技術躍遷的關鍵節點,強化學習、模型記憶、上下文工程等方向有望實現核心突破,推動模型從短文本生成向長思維鏈任務演進,并加速向原生多模態交互轉型。
在技術架構層面,基于Transformer的模型仍將是主流,但平衡性能與效率的混合專家模型(MoE)將成為行業共識。不同注意力機制路線將持續優化,預訓練階段將形成"Scaling-Law+高質量數據+強化學習"的協同范式。報告特別提到,隨著英偉達GB系列芯片的規模化應用,萬卡級算力集群將支撐模型參數量突破現有瓶頸,旗艦模型的智能上限有望再上新臺階。這一趨勢與海外科技巨頭如OpenAI、Gemini的布局形成呼應,國內廠商如DeepSeek、阿里千問等也在加速跟進。
強化學習的重要性被提升至新高度。該技術通過"自我生成數據+多輪迭代"的機制,顯著提升了模型的邏輯推理能力和人類偏好對齊度。中金分析指出,強化學習的關鍵在于大規模算力支撐與高質量數據供給,目前海內外頭部廠商均已將強化學習作為核心研發方向。預計2026年,強化學習在模型訓練中的占比將進一步提升,成為解鎖復雜決策、創造性任務等高級能力的關鍵路徑。
報告還關注到持續學習、模型記憶等新興技術路線。針對大模型普遍存在的"災難性遺忘"問題,Google提出的Titans、MIRAS等算法通過動態調整學習策略,使模型能夠根據任務特性選擇性記憶關鍵信息。這種機制不僅支持持續學習,甚至為終身學習提供了可能。與此同時,世界模型作為理解物理世界因果規律的重要工具,在Genie 3、Marble等不同技術路徑的探索下,有望在2026年實現突破性進展。
盡管前景樂觀,中金也提醒關注潛在風險。技術迭代速度可能低于預期,現有模型架構和訓練范式存在被顛覆的可能性。特別是在算力成本、數據質量、倫理規范等關鍵約束條件下,大模型技術的商業化落地仍面臨諸多不確定性。










