在馬年春晚的舞臺上,一款名為“小蓋”的銀河通用機器人憑借一系列令人驚嘆的操作成為全場焦點。它不僅能精細地盤核桃、撿玻璃碎片、從貨架取物,還能完成疊衣服、串烤腸等生活化任務,動作靈巧自然,仿佛擁有與人類無異的手部協調能力。與傳統機器人依賴預編程的表演不同,“小蓋”的所有操作均基于端到端的自主感知、決策與執行,展現了具身智能領域的重大突破。
“小蓋”的核心能力源于銀河通用自主研發的“銀河星腦 AstraBrain”大模型。這一全球首個集成“大腦-小腦-神經控制”的全身全手端到端模型,突破了傳統機器人技術路徑。它基于百億級具身智能數據集,通過虛實融合的訓練方式,讓機器人在虛擬世界中積累經驗,再通過少量真實世界操作微調,實現了從感知到行動的閉環。
以盤核桃為例,這一動作看似簡單,實則對機器人提出極高挑戰。核桃表面不規則、重量分布不均,手指受力點需實時調整,任何細微偏差都可能導致滑落。AstraBrain通過靈巧手神經動力學小腦模型破解難題:先在虛擬世界中讓機器手接觸各種虛擬核桃,通過試錯掌握基礎操作;再在真實環境中積累“物理手感”,利用真實摩擦力與機械誤差數據微調動作指令。最終,“小蓋”能像人類一樣靈活搓動、翻轉核桃,完成這一世界級靈巧操作難題。
撿玻璃碎片則考驗了機器人的感知極限。透明物體在視覺上近乎“隱形”,傳統算法難以識別其三維輪廓與抓取點。AstraBrain通過在仿真環境中生成海量透明物體數據——涵蓋不同厚度、碎裂形狀與光照條件——讓機器人“見過”各種可能形態。結合多模態感知融合技術,“小蓋”能從微弱反光邊緣與陰影變化中“看見”玻璃,并通過力覺感知控制抓取力度,既避免捏碎又防止滑落。這一能力為家庭清潔、工業回收等場景的透明物體處理提供了新可能。
貨架取貨場景中,“小蓋”需從緊密排列的商品中取下一瓶礦泉水,稍有不慎便會碰倒鄰品。AstraBrain通過強化學習框架,讓機器人在虛擬世界中經歷億萬次“取貨試錯”:碰到旁邊商品扣分,成功取下加分。經過自我博弈,它“悟”出最優路徑——先以手指扣住瓶蓋處,微微傾斜避讓鄰品,再調整角度穩穩抽出。這一過程完全自主決策,每一次扣動、傾斜與抓取均在毫秒級時間內根據環境實時調整。
疊衣服被視為機器人操作領域的終極挑戰之一。衣服作為柔性物體,每次拿起的狀態均不同,需實時判斷褶皺、預測折疊形態并規劃動作序列。AstraBrain在仿真環境中生成數萬種柔性物體變形數據,讓機器人“見過”各種褶皺形態,并學會從當前狀態推演最優路徑。當“小蓋”輕輕撫平衣角、精準對折時,它并非執行程序,而是調用海量仿真經驗進行實時決策,展現了“舉一反三”的泛化能力。
串烤腸則是對雙手協作與工具使用的雙重考驗。“小蓋”需一手操控烤鉗烤制,另一手抓取簽子,雙手協同完成串腸并遞給明星。AstraBrain的端到端架構讓“大腦”同時處理雙手獨立指令流,并在執行中實時調整。更關鍵的是,通過對海量仿真數據的學習,“小蓋”理解了工具的本質——烤鉗是手的延伸,是完成任務的媒介。這種泛化能力讓它能像人類一樣快速上手新工具。
“小蓋”的“類人”動作源于AstraBrain對人類數據的大規模仿真生成機制。相比采集機器人生硬動作,人類日常動作數據更豐富且易獲取。通過結合仿真生成,AstraBrain將人類動作先驗利用到極致,成為突破機器人大模型技術的關鍵方向。這一機制讓“小蓋”的舉手投足更貼近真人,透著親切感。
AstraBrain的技術框架可拆解為四步:首先通過少量人類示范理解任務核心意圖;其次在仿真環境中生成海量場景數據,讓機器人遍歷各種可能性;再通過強化學習閉環進行億萬次試錯迭代,優化操作精度;最后在真實世界中用少量數據微調,打通虛實隔閡。這一邏輯不僅適用于貨架取物,同樣能支撐盤核桃、疊衣服等復雜任務,讓機器人掌握快速學習新技能的通用能力。










