當(dāng)小米正式推出MiMo-V2-Pro大模型時(shí),科技圈的目光卻意外投向了另一位科技巨頭——馬斯克。這位以顛覆性創(chuàng)新聞名的企業(yè)家,其創(chuàng)立的xAI公司正陷入前所未有的尷尬境地:盡管擁有超過(guò)500億美元的融資規(guī)模和來(lái)自O(shè)penAI、DeepMind等頂尖機(jī)構(gòu)的聯(lián)合創(chuàng)始人團(tuán)隊(duì),最新發(fā)布的Grok 4.20 Beta在權(quán)威評(píng)測(cè)Artificial Analysis Intelligence Index上僅取得48分,而小米的同代模型卻以49分險(xiǎn)勝。這場(chǎng)看似偶然的分?jǐn)?shù)超越,實(shí)則折射出AI競(jìng)賽中技術(shù)路線選擇的深層差異。
小米的AI征程始于2023年4月成立的AI實(shí)驗(yàn)室大模型團(tuán)隊(duì),但真正意義上的通用基礎(chǔ)大模型研發(fā)要到2024年底才正式啟動(dòng)。這個(gè)由雷軍親自掛帥的團(tuán)隊(duì),在架構(gòu)設(shè)計(jì)上并未追求標(biāo)新立異:1T參數(shù)、42B激活參數(shù)、100萬(wàn)token上下文窗口的配置,與行業(yè)主流方案并無(wú)本質(zhì)區(qū)別。真正讓MiMo-V2-Pro脫穎而出的,是其后訓(xùn)練階段的三項(xiàng)核心技術(shù)突破。其中最引人注目的是MOPD(多教師在線策略蒸餾)技術(shù),這項(xiàng)技術(shù)通過(guò)構(gòu)建代碼、搜索、數(shù)學(xué)推理、安全對(duì)齊等領(lǐng)域的專家教師模型,讓學(xué)生模型在生成回答時(shí)同時(shí)接受多個(gè)教師的實(shí)時(shí)監(jiān)督。實(shí)驗(yàn)數(shù)據(jù)顯示,采用該技術(shù)訓(xùn)練的模型在AIME 2025數(shù)學(xué)競(jìng)賽中取得94.1分,甚至在部分項(xiàng)目上超越了教師模型的表現(xiàn)。
在強(qiáng)化學(xué)習(xí)訓(xùn)練方面,小米構(gòu)建了包含12萬(wàn)個(gè)真實(shí)交互場(chǎng)景的agent訓(xùn)練體系。代碼agent直接從GitHub Issues中提取訓(xùn)練數(shù)據(jù),在模擬環(huán)境中完成讀文件、改代碼、運(yùn)行測(cè)試的全流程;終端agent則將Stack Overflow上的技術(shù)難題轉(zhuǎn)化為帶有完整Docker環(huán)境的計(jì)算任務(wù)。這種"真實(shí)世界實(shí)習(xí)"式的訓(xùn)練方式,使模型在數(shù)學(xué)推理、通用推理等任務(wù)上展現(xiàn)出顯著的泛化能力。與之形成對(duì)比的是,多數(shù)大模型的強(qiáng)化學(xué)習(xí)仍停留在"單輪答題"的封閉環(huán)境,難以應(yīng)對(duì)復(fù)雜多變的現(xiàn)實(shí)場(chǎng)景。
資源管理領(lǐng)域的創(chuàng)新同樣值得關(guān)注。小米與北京大學(xué)聯(lián)合研發(fā)的ARL-Tangram系統(tǒng),通過(guò)將外部調(diào)用拆解為原子動(dòng)作并實(shí)現(xiàn)資源的動(dòng)態(tài)釋放,使AI編程任務(wù)中的動(dòng)作完成時(shí)間提升最高4.3倍,外部資源消耗降低71.2%。這項(xiàng)突破有效解決了傳統(tǒng)RL框架中資源閑置率高達(dá)53%的痛點(diǎn),為大規(guī)模模型訓(xùn)練提供了性價(jià)比更高的解決方案。在MiMo-V2-Pro的訓(xùn)練場(chǎng)景中,該系統(tǒng)使12個(gè)教師模型的GPU平均流式多處理器活躍率從不到3%提升至合理水平,顯著提高了算力利用率。
對(duì)于小米而言,MiMo-V2-Pro的意義遠(yuǎn)不止于技術(shù)突破。這家長(zhǎng)期被貼上"硬件性價(jià)比之王"標(biāo)簽的企業(yè),正通過(guò)AI技術(shù)重塑品牌形象。在Artificial Analysis Intelligence Index全球排行榜上,小米以中國(guó)第二、全球前十的成績(jī),首次在純技術(shù)維度獲得國(guó)際認(rèn)可。更關(guān)鍵的是,該模型與小米汽車業(yè)務(wù)的協(xié)同效應(yīng)開始顯現(xiàn):云端大模型負(fù)責(zé)復(fù)雜決策和訓(xùn)練仿真,端側(cè)輕量模型承擔(dān)實(shí)時(shí)推理任務(wù),這種"云-邊-端"協(xié)同架構(gòu)正在為小米智能駕駛技術(shù)注入新動(dòng)能。2026年3月,小米汽車完成組織架構(gòu)調(diào)整,將感知與規(guī)控部門合并為端到端算法部,其技術(shù)路線選擇與MiMo-V2-Pro的研發(fā)理念形成強(qiáng)烈呼應(yīng)。
反觀特斯拉,其AI戰(zhàn)略卻呈現(xiàn)出明顯的割裂感。盡管Grok模型在2025年底通過(guò)Holiday Update進(jìn)入車機(jī)系統(tǒng),但實(shí)際功能僅限于導(dǎo)航設(shè)置和基礎(chǔ)對(duì)話,與FSD自動(dòng)駕駛系統(tǒng)缺乏深度協(xié)同。2026年3月宣布的"Digital Optimus"項(xiàng)目試圖構(gòu)建"高層推理大腦"與"實(shí)時(shí)感知系統(tǒng)"的雙模型架構(gòu),但具體實(shí)現(xiàn)路徑仍不清晰。這種技術(shù)路線上的模糊性,與小米"云端蒸餾到端側(cè)"的明確路徑形成鮮明對(duì)比。更值得關(guān)注的是,特斯拉車內(nèi)控制座艙的AI系統(tǒng)實(shí)際上獨(dú)立于xAI體系,這種組織架構(gòu)上的割裂可能進(jìn)一步制約其AI技術(shù)的整合效率。
然而,小米的AI突圍并非毫無(wú)隱憂。在備受關(guān)注的SWE-bench Verified編程測(cè)試集中,MiMo-V2-Pro取得78.0%的成績(jī),接近Claude 4.6 Sonnet的79.6%。但OpenAI研究團(tuán)隊(duì)已明確指出,該測(cè)試集存在"任務(wù)ID泄露"問(wèn)題,多個(gè)前沿模型僅憑題目編號(hào)就能復(fù)現(xiàn)正確答案。小米尚未公布其在更嚴(yán)格的SWE-bench Pro測(cè)試集上的表現(xiàn),而這一版本被業(yè)界視為2026年衡量編碼能力的真正標(biāo)尺。MiMo-V2-Pro的模型權(quán)重尚未開源,官方解釋稱"待模型穩(wěn)定后開放",這反映出該技術(shù)在魯棒性方面可能仍存在提升空間。
在ARC-AGI-2推理泛化測(cè)試中,純大語(yǔ)言模型僅取得1%的得分,最佳推理系統(tǒng)也不過(guò)54%,與人類60%的平均水平存在差距;Frontier Math數(shù)學(xué)推理測(cè)試和按月更新的LiveCodeBench v6編程評(píng)測(cè)等新一代基準(zhǔn),同樣未出現(xiàn)在小米的測(cè)試成績(jī)單中。這些測(cè)試集的缺席,某種程度上反映出當(dāng)前AI模型在復(fù)雜推理和持續(xù)學(xué)習(xí)能力上的局限。對(duì)于正在向"AI公司"轉(zhuǎn)型的小米而言,如何平衡技術(shù)展示與實(shí)際能力,將是其需要長(zhǎng)期面對(duì)的課題。










