春節期間,中國AI行業迎來一場前所未有的技術競賽,各大廠商密集發布新一代大模型,推動國產AI技術進入全新發展階段。這場競爭不僅體現在模型性能的突破上,更折射出中國AI企業爭奪移動端入口的戰略野心。
在這場技術狂歡中,智譜科技推出的GLM-5成為焦點。該模型參數規模從3550億擴展至7440億,激活參數提升至400億,預訓練數據量增加至28.5TB。更引人注目的是,GLM-5首次引入DeepSeek的稀疏注意力機制,在保持長文本處理能力的同時,將部署成本降低30%,Token利用效率提升25%。內部測試顯示,其在編程開發場景中的性能較前代提升超20%,接近國際頂尖水平。
MiniMax的M2.5模型則選擇差異化競爭路線。這款專為Agent場景設計的生產級模型,激活參數量僅100億,卻在編程與智能體性能上直接對標Claude Opus 4.6。其支持100 TPS的超高吞吐量,推理速度遠超同類國際模型,在Excel高階處理、深度調研等生產力場景中表現尤為突出。這種"小參數、高性能"的設計思路,為AI模型商業化提供了新范式。
頭部企業的競爭愈發激烈。字節跳動一次性推出三款模型:視頻生成模型Seedance 2.0、圖像生成模型Seedream 5.0和通用大模型豆包2.0。其中Seedance 2.0憑借出色的視頻生成效果,被業界視為潛在爆款產品。阿里巴巴則計劃投入30億元獎勵計劃,配合Qwen 3.5的發布搶占市場。DeepSeek更被曝正在研發支持100萬Token上下文長度的V4版本,重點強化編碼和超長提示詞處理能力。
這場技術競賽已產生顯著市場效應。芯片板塊率先受益,號稱"國產GPU四小龍"的天數智芯股價單日漲幅達25%,壁仞科技漲近10%,兆易創新漲幅超8%。市場分析認為,AI算力需求的持續升溫,將推動硬件廠商進入新一輪增長周期。上海某AI企業負責人指出,國產大模型從價格競爭轉向技術競爭,標志著行業成熟度顯著提升。
值得注意的是,本輪模型升級普遍聚焦實際應用場景。GLM-5在編程體驗上逼近國際頂尖水平,M2.5專注生產力工具優化,字節跳動的新模型直指內容創作領域。這種轉變反映出中國AI企業正在從技術追趕轉向場景創新,試圖通過差異化競爭打破國際壟斷格局。隨著春節發布季的持續,這場移動端入口爭奪戰將進入白熱化階段。











