春節(jié)期間,中國人工智能領(lǐng)域迎來一場激烈的技術(shù)競賽,多家頭部企業(yè)接連發(fā)布大模型新版本,引發(fā)全球關(guān)注。其中,MiniMax公司推出的M2.5模型憑借編程與智能體能力成為焦點(diǎn),其SWE-Bench Verified得分達(dá)80.2%,Multi-SWE-Bench以51.3%的成績登頂全球榜單,性能直追國際頂尖模型Claude Opus 4.6,而價格僅為后者的二十分之一。這一突破標(biāo)志著國產(chǎn)大模型在工程化落地方面邁出關(guān)鍵一步。
技術(shù)社區(qū)的快速響應(yīng)印證了M2.5的影響力。開源項(xiàng)目OpenClaw在模型發(fā)布后立即將其列為推薦模型,開發(fā)者通過OAuth插件即可在Telegram、WhatsApp等平臺部署AI助手,每小時成本低至1美元。這種技術(shù)生態(tài)的聯(lián)動效應(yīng),使得M2.5在Hugging Face開源后迅速積累大量衍生應(yīng)用,從自動化辦公到智能客服,場景覆蓋持續(xù)擴(kuò)大。
資本市場的反應(yīng)同樣熱烈。MiniMax上市僅39天,股價從發(fā)行價165港元飆升至847港元,累計漲幅超過413%,市值突破2656億港元。這種市場表現(xiàn)背后,是公司每45天迭代一個主要版本的技術(shù)速度——從2025年10月的M2到2026年2月的M2.5,三個版本更新周期較預(yù)期縮短近三分之一。
在技術(shù)實(shí)現(xiàn)層面,M2.5的突破源于對強(qiáng)化學(xué)習(xí)規(guī)模化應(yīng)用的深度探索。研究團(tuán)隊通過自研RL框架Forge,在算法優(yōu)化、獎勵信號設(shè)計和基礎(chǔ)設(shè)施工程等方面取得進(jìn)展。一個典型案例是FP32精度問題的解決:在M1時期,團(tuán)隊發(fā)現(xiàn)語言模型頭因數(shù)值精度不足導(dǎo)致訓(xùn)練偏差,切換至32位浮點(diǎn)數(shù)后性能顯著提升。這種從理論算法到工程實(shí)現(xiàn)的極致優(yōu)化,成為MiniMax技術(shù)演進(jìn)的核心方法論。
智能體對齊(Agent Alignment)是M2系列研發(fā)的另一重點(diǎn)。研究團(tuán)隊構(gòu)建了包含敏感性安全和對齊安全的多維度評估體系,通過與開發(fā)者混合辦公的模式,實(shí)時修正模型行為。高級研究員Olive Song透露,發(fā)布前兩周會進(jìn)行大規(guī)模壓力測試,但開放權(quán)重后用戶行為仍存在不可控因素,"這需要法律、倫理與技術(shù)的協(xié)同應(yīng)對"。
編碼能力的強(qiáng)化并非技術(shù)路徑的偏移,而是通向通用智能的階梯。Olive Song解釋稱,編程本質(zhì)是結(jié)構(gòu)化世界的工程語言,M2.5在報告寫作、PPT生成等通用任務(wù)上已展現(xiàn)潛力。未來版本將重點(diǎn)突破長程任務(wù)處理,通過定義復(fù)雜目標(biāo)、構(gòu)建多樣化環(huán)境、優(yōu)化RL基礎(chǔ)設(shè)施三層架構(gòu),提升模型在多步驟規(guī)劃中的穩(wěn)定性。
開源戰(zhàn)略的選擇折射出技術(shù)哲學(xué)的差異。盡管商業(yè)層面存在API收入減少的顧慮,但研究團(tuán)隊堅信社區(qū)協(xié)作能加速技術(shù)進(jìn)化。MiniMax與vLLM、SGLang等推理框架的深度合作,以及基于M2.5涌現(xiàn)的自動化辦公應(yīng)用,驗(yàn)證了這種開放生態(tài)的商業(yè)價值。實(shí)測數(shù)據(jù)顯示,三個M2.5 Agent協(xié)同工作的成本僅為閉源模型的5%。
在模型評估體系構(gòu)建上,研究團(tuán)隊保持著異常嚴(yán)謹(jǐn)?shù)膽B(tài)度。Olive Song指出,專業(yè)評估需要足夠數(shù)量的測試題和多次驗(yàn)證,當(dāng)前行業(yè)普遍采用的"五個問題測試法"遠(yuǎn)未達(dá)到統(tǒng)計置信度要求。她個人維護(hù)著涵蓋邏輯推理、數(shù)學(xué)證明等領(lǐng)域的測試集,用于持續(xù)追蹤模型進(jìn)化軌跡。
面對AGI(通用人工智能)的終極命題,Olive Song的回答體現(xiàn)出工程思維特質(zhì):"定義會在實(shí)現(xiàn)過程中自然清晰,現(xiàn)在更重要的是讓模型具備持續(xù)探索環(huán)境、定義自身目標(biāo)的能力。"這種務(wù)實(shí)態(tài)度貫穿于MiniMax的技術(shù)實(shí)踐——從用Agent追蹤學(xué)術(shù)動態(tài)的內(nèi)部工具,到通過系統(tǒng)提示詞實(shí)現(xiàn)角色切換的模型設(shè)計,都在為更復(fù)雜的智能形態(tài)鋪路。
當(dāng)被問及研究工作的本質(zhì)變化時,Olive Song提到兩個關(guān)鍵轉(zhuǎn)折:從跟隨論文到解決前人未遇的問題,從實(shí)驗(yàn)室玩具級實(shí)驗(yàn)到應(yīng)對千萬級參數(shù)的工程挑戰(zhàn)。這種認(rèn)知轉(zhuǎn)變,或許正是中國AI企業(yè)在全球競賽中實(shí)現(xiàn)后來居上的深層密碼。











