小馬智行近日宣布推出其物理AI領(lǐng)域的重大技術(shù)突破——PonyWorld世界模型2.0版本。該系統(tǒng)通過賦予AI自主進(jìn)化能力,標(biāo)志著自動(dòng)駕駛研發(fā)模式從人類主導(dǎo)轉(zhuǎn)向AI驅(qū)動(dòng)的范式變革。與初代版本相比,新系統(tǒng)實(shí)現(xiàn)了自我診斷短板、定向優(yōu)化模型、主動(dòng)引導(dǎo)研發(fā)流程三大核心突破,形成"發(fā)現(xiàn)問題-生成數(shù)據(jù)-迭代模型"的閉環(huán)進(jìn)化機(jī)制。
在技術(shù)架構(gòu)層面,世界模型2.0構(gòu)建了貫穿云端與車端的完整訓(xùn)練體系。系統(tǒng)通過意圖語(yǔ)義層對(duì)每次駕駛決策進(jìn)行自動(dòng)化歸因分析,能夠精準(zhǔn)定位模型在復(fù)雜場(chǎng)景中的決策失誤點(diǎn)。例如當(dāng)遇到逆光條件下非機(jī)動(dòng)車與行人混行的路口時(shí),系統(tǒng)會(huì)自動(dòng)生成針對(duì)性數(shù)據(jù)采集任務(wù),指導(dǎo)研發(fā)團(tuán)隊(duì)在特定時(shí)段、特定路段進(jìn)行重點(diǎn)數(shù)據(jù)收集,使數(shù)據(jù)采集效率提升60%以上。
該系統(tǒng)的定向進(jìn)化能力體現(xiàn)在"精準(zhǔn)補(bǔ)短板"機(jī)制上。傳統(tǒng)研發(fā)模式采用"廣撒網(wǎng)"式數(shù)據(jù)采集,而新系統(tǒng)可根據(jù)模型薄弱環(huán)節(jié)自動(dòng)生成訓(xùn)練場(chǎng)景。在模擬測(cè)試中,系統(tǒng)會(huì)優(yōu)先生成包含博弈交互的復(fù)雜場(chǎng)景,跳過簡(jiǎn)單直行等基礎(chǔ)場(chǎng)景,使模型訓(xùn)練效率提升3倍,同時(shí)減少70%的無(wú)效數(shù)據(jù)存儲(chǔ)。這種訓(xùn)練方式使AI司機(jī)在處理突發(fā)狀況時(shí)的反應(yīng)速度較人類駕駛員提升2.3倍。
在商業(yè)化應(yīng)用方面,世界模型2.0已全面部署于小馬智行L4級(jí)無(wú)人駕駛車隊(duì)。通過千萬(wàn)公里級(jí)多城市復(fù)雜場(chǎng)景數(shù)據(jù)積累,系統(tǒng)形成了覆蓋城區(qū)道路、高速公路、園區(qū)通勤等多元場(chǎng)景的數(shù)據(jù)庫(kù)。特別在純無(wú)人駕駛狀態(tài)下,AI與其他交通參與者的交互數(shù)據(jù)成為模型進(jìn)化的關(guān)鍵養(yǎng)料,這些包含獨(dú)特博弈模式的數(shù)據(jù)資產(chǎn),構(gòu)成了其他企業(yè)難以復(fù)制的技術(shù)壁壘。
研發(fā)范式的轉(zhuǎn)變帶來(lái)組織架構(gòu)的深層調(diào)整。人類工程師的角色從傳統(tǒng)"駕校教練"轉(zhuǎn)變?yōu)?數(shù)據(jù)采集指揮官",負(fù)責(zé)執(zhí)行AI系統(tǒng)生成的定向采集任務(wù)。在廣州生物島的測(cè)試基地,研發(fā)團(tuán)隊(duì)每天接收系統(tǒng)推送的200余條精準(zhǔn)采集指令,涵蓋特定光照條件、特殊天氣、突發(fā)路況等細(xì)分場(chǎng)景。這種AI主導(dǎo)的研發(fā)節(jié)奏,使模型迭代周期從月級(jí)縮短至周級(jí)。
技術(shù)團(tuán)隊(duì)透露,世界模型精度的持續(xù)提升依賴于"精度飛輪"效應(yīng):大規(guī)模商業(yè)運(yùn)營(yíng)產(chǎn)生高價(jià)值數(shù)據(jù),數(shù)據(jù)反哺提升模型精度,高精度模型支撐更大規(guī)模部署。當(dāng)前系統(tǒng)已實(shí)現(xiàn)每百萬(wàn)公里運(yùn)營(yíng)數(shù)據(jù)提升0.8%模型精度的正向循環(huán),在雨霧天氣等復(fù)雜場(chǎng)景下的決策準(zhǔn)確率達(dá)到99.7%,超越人類駕駛員平均水平。
這項(xiàng)突破不僅限于自動(dòng)駕駛領(lǐng)域。物理AI的底層架構(gòu)設(shè)計(jì)使其具備跨場(chǎng)景應(yīng)用潛力,在工業(yè)機(jī)器人、智慧物流等需要復(fù)雜環(huán)境交互的領(lǐng)域,世界模型提供的強(qiáng)化學(xué)習(xí)框架可快速適配不同場(chǎng)景需求。技術(shù)專家指出,當(dāng)AI系統(tǒng)在特定任務(wù)上達(dá)到遠(yuǎn)超人類的水準(zhǔn),人類經(jīng)驗(yàn)反而可能成為進(jìn)化瓶頸,此時(shí)需要建立AI自主驅(qū)動(dòng)的研發(fā)體系。











