春節檔向來是科技企業競相角逐的黃金時段,今年國產人工智能大模型領域掀起新一輪“上新潮”,多家企業密集推出新品,引發行業高度關注。上海企業MiniMax率先發力,其新一代文本模型MiniMax M2.5于2月12日正式上線,次日即面向全球開源并支持本地化部署。這款被業界稱為“王炸”的模型,在性能上與美國Anthropic公司開發的Claude Opus 4.6不相上下,但價格僅為后者的二十分之一,迅速引發全球開發者熱議。
M2.5的突破性體現在多個維度。在編程能力方面,該模型在SWE-Bench Verified榜單上取得80.2%的高分,與Claude Opus 4.6差距微乎其微;在多語言任務測試中,更以絕對優勢超越對手登頂榜首。辦公場景應用同樣出色,其生成的財務報表格式規范、數據分層清晰,在金融建模等復雜任務中展現出專業水準。更令人矚目的是,這款性能強勁的模型參數量僅100億,堪稱全球同類旗艦模型中的“輕量級冠軍”。
價格與效率的雙重優勢成為M2.5的核心競爭力。該模型推理速度達每秒100次事務處理,較主流模型提升近一倍;輸入成本約0.3美元/百萬Token,輸出成本2.4美元/百萬Token。按每秒輸出100Token計算,1美元即可支持智能體連續工作一小時,這種“白菜價”策略被開發者稱為“顛覆性創新”。OpenClaw項目創始人彼得·斯坦伯格評價稱,M2.5在保持高性能的同時,成功解決了大模型“昂貴”與“遲緩”的行業痛點。
競爭格局因另一款國產模型的加入而更加激烈。2月11日登陸港交所的智譜AI,緊隨其后發布GLM-5模型。這款被定位為“系統架構師”的新品,在編程與智能體協作能力上表現突出。開發者實測顯示,GLM-5在真實編程場景中的體驗已接近Claude頂級模型水平。在全球權威評測榜單Artificial Analysis中,GLM-5位列全球第四、開源模型第一。該模型特別強化了多智能體協作能力,可像人類工程師般分配任務、構建系統,在代理編程測試中略勝Claude一籌。
圖像生成領域同樣迎來重要突破。2月10日,千問團隊推出Qwen-Image 2.0模型,支持超長指令輸入(達1000詞元),顯著提升推理能力。其開發團隊透露,新模型成功解決AI生成圖像中的“漢字亂碼”難題,通過增強指令理解能力,使圖片中的文字呈現更加準確。幾乎同時,字節跳動發布Seedream 5.0模型,在文生圖質量上實現跨越式提升。這兩款模型的推出,標志著國產多模態大模型進入新的發展階段。
基礎大語言模型領域也不乏亮點。DeepSeek近期低調上線新款模型,雖未涉及多模態功能,但將上下文處理能力提升至100萬詞元,相當于可一次性理解整套《三體》小說(約90萬字)。開發者指出,目前支持百萬級詞元處理的模型屈指可數,DeepSeek此次升級使其躋身谷歌Gemini、Anthropic Claude等國際頂尖模型行列。
據行業觀察,這波“上新潮”遠未結束。豆包2.0、千問3.5等旗艦模型將于近期陸續發布,國產大模型正通過持續創新重塑全球競爭格局。從文本生成到多模態交互,從基礎能力到場景應用,中國AI企業正以集群式突破,在春節檔這個特殊時間節點向世界展示技術實力。這場沒有硝煙的競爭,不僅關乎企業市場份額,更決定著未來人工智能生態的主導權歸屬。








