春節(jié)前夕,國產(chǎn)AI大模型領(lǐng)域迎來新一輪激烈競爭,DeepSeek、智譜、字節(jié)跳動等企業(yè)紛紛推出模型更新。其中,MiniMax-M2.5的正式上線引發(fā)行業(yè)關(guān)注,該模型在Agent智能體與編程能力方面實現(xiàn)顯著突破。
據(jù)MiniMax AI工程團(tuán)隊在海外社交平臺披露,研發(fā)過程中隨著訓(xùn)練計算資源的持續(xù)投入,模型性能呈現(xiàn)階梯式提升。團(tuán)隊負(fù)責(zé)人幽默表示,既期待產(chǎn)品盡快發(fā)布以便回家過年,又為效果優(yōu)化帶來的延遲感到糾結(jié)。目前用戶已可在平臺選擇使用M2.5版本。
在實測環(huán)節(jié),該模型展現(xiàn)出突出的網(wǎng)頁開發(fā)能力。當(dāng)要求制作蘋果公司投資分析儀表盤時,系統(tǒng)不僅完整呈現(xiàn)財務(wù)健康度、技術(shù)面分析等核心指標(biāo),還通過動態(tài)圖表實現(xiàn)數(shù)據(jù)可視化交互。用戶鼠標(biāo)懸停即可查看具體數(shù)值,SWOT分析模塊的詳細(xì)程度超出預(yù)期。更令人驚喜的是,輸入簡單指令即可生成可運(yùn)行的"黃金礦工"網(wǎng)頁游戲,包含完整的關(guān)卡設(shè)計和音效系統(tǒng)。
專業(yè)文檔生成方面,模型展現(xiàn)出強(qiáng)大的結(jié)構(gòu)化處理能力。在梳理AI開源推理生態(tài)的測試中,其輸出的6000字報告采用表格對比不同框架特性,內(nèi)容詳實度獲得認(rèn)可。針對AI 3D建模工具開發(fā)需求,系統(tǒng)自動生成包含用戶畫像、功能需求、運(yùn)營路徑的多維度文檔,關(guān)鍵信息覆蓋率達(dá)90%以上。
PPT制作測試出現(xiàn)有趣現(xiàn)象,為提升內(nèi)容吸引力,模型創(chuàng)造性地運(yùn)用比喻修辭手法。在講解唐代歷史時,將長安城比作現(xiàn)代一線城市,用"朋友圈"概念解釋文人社交,這種年輕化表達(dá)方式顯著增強(qiáng)了內(nèi)容親和力。不過在版式設(shè)計精細(xì)度方面仍有改進(jìn)空間,部分圖表存在對齊偏差問題。
定時任務(wù)執(zhí)行暴露出信息時效性短板。在科技新聞?wù)蝿?wù)中,系統(tǒng)抓取的8條資訊均來自2025年舊聞,未能滿足24小時內(nèi)新鮮資訊的要求。雖然內(nèi)容總結(jié)準(zhǔn)確,但已喪失新聞核心價值。TikTok趨勢分析任務(wù)表現(xiàn)相對較好,不僅識別出熱門挑戰(zhàn)和音頻標(biāo)簽,還能根據(jù)平臺特性給出內(nèi)容創(chuàng)作建議。
視頻生成測試顯示,模型對復(fù)雜場景的理解能力有待加強(qiáng)。當(dāng)要求制作特定犬種的運(yùn)動視頻時,雖然畫面氛圍和背景元素還原準(zhǔn)確,但主角犬種出現(xiàn)偏差。不過在物體運(yùn)動軌跡和光影效果處理上,已達(dá)到行業(yè)中等水平。
資本市場對技術(shù)突破反應(yīng)迅速,MiniMax股價在消息公布后單日漲幅達(dá)14.62%,盤中最高沖至23.5%,公司總市值突破1600億元人民幣。根據(jù)港交所披露,企業(yè)將于3月初發(fā)布年度財務(wù)報告,屆時可能公布更多技術(shù)商業(yè)化進(jìn)展。
從行業(yè)視角觀察,Agent能力與編程開發(fā)已成為大模型競爭的核心賽道。雖然MiniMax-M2.5在多個場景展現(xiàn)實用價值,但測試結(jié)果顯示其輸出結(jié)果仍需人工校對,需求理解準(zhǔn)確率存在波動。這種"可用但需優(yōu)化"的狀態(tài),恰是當(dāng)前AI技術(shù)發(fā)展的普遍特征。





