阿里巴巴達(dá)摩院近日在具身智能領(lǐng)域取得重大突破,正式推出全球首個(gè)具備時(shí)空記憶與物理世界推理能力的智能大腦基礎(chǔ)模型RynnBrain,并同步開源包含30B MoE架構(gòu)在內(nèi)的7個(gè)全尺寸模型矩陣。該模型在16項(xiàng)國(guó)際權(quán)威評(píng)測(cè)中刷新紀(jì)錄,超越谷歌Gemini Robotics ER 1.5等頂尖系統(tǒng),標(biāo)志著機(jī)器人智能水平邁入新階段。
傳統(tǒng)機(jī)器人系統(tǒng)在執(zhí)行多任務(wù)時(shí)面臨顯著局限,而RynnBrain通過(guò)創(chuàng)新性引入時(shí)空記憶模塊,使機(jī)器人具備任務(wù)狀態(tài)記憶能力。實(shí)驗(yàn)顯示,當(dāng)機(jī)器人執(zhí)行A任務(wù)途中被要求優(yōu)先完成B任務(wù)時(shí),系統(tǒng)可精準(zhǔn)記錄A任務(wù)的空間坐標(biāo)、物體狀態(tài)及時(shí)間節(jié)點(diǎn),待B任務(wù)完成后自動(dòng)恢復(fù)A任務(wù)進(jìn)程。這種能力在倉(cāng)儲(chǔ)物流、醫(yī)療護(hù)理等復(fù)雜場(chǎng)景中具有重要應(yīng)用價(jià)值。
在技術(shù)架構(gòu)層面,RynnBrain突破性地實(shí)現(xiàn)認(rèn)知、定位、推理、規(guī)劃等能力的深度融合。通過(guò)模塊化設(shè)計(jì),該模型可快速衍生出導(dǎo)航、操作、交互等垂直領(lǐng)域模型。以具身規(guī)劃模型為例,僅需數(shù)百條場(chǎng)景數(shù)據(jù)微調(diào)即可達(dá)到行業(yè)領(lǐng)先水平,在動(dòng)態(tài)障礙物避讓、多目標(biāo)路徑優(yōu)化等任務(wù)中表現(xiàn)尤為突出。
開源生態(tài)建設(shè)方面,達(dá)摩院此次釋放的模型矩陣涵蓋從1B到30B不同參數(shù)規(guī)模,其中30B MoE模型通過(guò)專家混合架構(gòu)實(shí)現(xiàn)效率躍升,使機(jī)器人動(dòng)作響應(yīng)速度提升40%。配套發(fā)布的RynnBrain-Bench評(píng)測(cè)基準(zhǔn),首次建立時(shí)空細(xì)粒度任務(wù)評(píng)估體系,包含動(dòng)態(tài)環(huán)境適應(yīng)、長(zhǎng)期任務(wù)記憶等200余項(xiàng)測(cè)試指標(biāo),為行業(yè)提供標(biāo)準(zhǔn)化評(píng)估工具。
據(jù)項(xiàng)目負(fù)責(zé)人趙德麗介紹,RynnBrain的研發(fā)突破了傳統(tǒng)具身智能"大腦-小腦"分離架構(gòu)的局限,通過(guò)構(gòu)建統(tǒng)一的世界模型實(shí)現(xiàn)感知-認(rèn)知-決策的閉環(huán)。目前該系統(tǒng)已在工業(yè)分揀、家庭服務(wù)等場(chǎng)景完成驗(yàn)證,其多模態(tài)交互能力可支持機(jī)器人理解復(fù)雜指令并自主規(guī)劃解決方案。
達(dá)摩院具身智能實(shí)驗(yàn)室同步開源了WorldVLA視覺(jué)語(yǔ)言動(dòng)作模型、RynnEC世界理解框架等組件,并制定首個(gè)機(jī)器人上下文通信協(xié)議RynnRCP。這些技術(shù)成果將降低具身智能研發(fā)門檻,推動(dòng)AI技術(shù)從數(shù)字空間向物理世界的加速滲透。








