編輯:元宇
Figure 03這次不像是機器人,更像第一次真正「住進」了人類的廚房。
幫你洗碗的家務機器人來了?
剛剛,一段Figure 03在廚房干活的視頻被網友刷爆了。
它是Figure AI推出的最新機器人,搭載了其最新的Helix 02系統。
與早期的Helix僅能控制上半身相比,Helix 02實現了全身級自主控制,顯著提升了其在真實環境中自主決策和全身動作控制的能力。
在視頻中,Figure03在廚房里「像人一樣」干起活來,全程無需人工干預。
Figure03的一些小動作,直接把很多網友都看呆了。
比如,當它正準備轉身把抓起的廚房用具放入洗碗機時,身旁打開的抽屜擋住了它的去路。
按照以往邏輯,機器人大概率會先放下手里的東西,轉身,用手關上抽屜,再重新拿起碗碟。
但Figure 03只是身體順勢一轉,用胯部輕輕一頂,就把抽屜關上了,動作絲滑如行云流水,就像人們在廚房中忙亂時的下意識動作一樣。
不僅如此,它還會用腳抬起洗碗機門,這說明它已經具備了利用全身協作的能力,能夠將整個身體作為工具,而不僅僅依賴雙手。
Figure AI宣稱,Helix 02是他們迄今為止能力最強的人形機器人模型,它采用了單一的神經系統,在整個房間范圍內實現「靈巧、長時程的自主行為」。
Figure創始人Brett Adcock直言,「會跳舞的機器人并不稀奇,難的是實現智能控制」。
Figure 03所展現的「智能控制」突破,主要體現在以下核心能力上:
受限環境下的穩健操作: 即便手持易碎品(如玻璃杯),機器人也能在移動中保持步伐穩定與抓握精準,確保物品平穩不晃動。
全程雙手協同:在物體的拾取、傳遞、堆疊及放置過程中,雙臂不再是獨立運作,而是作為一個整體系統進行完美的協調配合。
跨尺度運動控制:基于同一神經網絡,Figure 03既能執行毫米級的手指微操,又能駕馭房間尺度的全身移動,其動態控制范圍跨越了四個數量級。
除上述運動控制外,Figure 03還展現了長時序的動作規劃能力。
它能夠按邏輯順序執行包含移動與操作的復雜任務序列,并具備隱式的錯誤恢復機制,從而在數分鐘的連續執行中保持任務狀態不掉線。
Figure 03的自主性與未來感設計引發了熱烈討論。
推特用戶Chubby盛贊其「擬人化」的步伐和設計是革命性的進步。
許多網友對Figure 03的自主性和設計而感到驚嘆,認為這是革命性的進步。
然而,并非所有人都為此買單。
網友Zamiel Cano直言,在Tesla Optimus面前,其他機器人都顯得「毫無價值」,并堅信Optimus終將主宰整個行業。
還有網友認為Figure 03只能做到在飯后清理餐桌、把餐具放進洗碗機這些還不夠,還要能夠規劃餐食并訂購食材。
告別「回合制」
把「走路+干活」揉成一個大腦
視頻中的Figure03,展示了驚人的「全身協同」能力。
它不再把身體拆分成「走路的腿」和「干活的手」,而是像人一樣,把整個身體當成一個統一的工具。
這標志著Helix02突破了幾十年來傳統機器人領域最棘手的難題之一:真正統一行走與操作。
因為在傳統機器人的大腦里,走路和干活是兩套完全分開的程序。
它們就像在玩回合制游戲:
第一回合:走到桌子前(停止腿部運動,站穩)。
第二回合:伸出手臂(鎖定下盤,只動上半身)。
第三回合:抓住物體(收回手臂)。
第四回合:再次啟動腿部(轉身,走)。
這種模式不僅效率極低,而且充滿了機械的僵硬感。
真正的自主性需要一個能夠同時對全身進行推理的單一學習系統。
該系統能持續感知、決策并行動,比如在搬運物品的同時行走,在伸手夠物時調整平衡,并實時從錯誤中恢復。
Helix02正是如此。
它第一次把人形機器人的「走路+干活」揉成一個大腦,實現了「行走-操作」的真正統一。
Helix 02在原有的系統1(System 1,S1)、系統2(System 2,S2)架構的基礎上,新增了一個基礎層:系統0(System 0,S0)。
每個系統都以自身的自然時間尺度運行。
S2(大腦)負責理解復雜的指令,緩慢地進行目標推理:解讀場景、理解語言并規劃行為序列。
S1(脊髓)負責敏捷的動作執行,快速思考,以200 Hz的頻率將感知轉化為全身關節的目標指令。
S0(小腦)負責穩健的身體控制,以1 kHz 的頻率執行,負責全身的平衡、接觸與協調。
S0
基于人類數據的「運動直覺」
S0為機器人提供「運動直覺」,它是一個用于機器人全身控制的基礎模型,是Helix 02物理具身的核心基礎。
當更高層級負責任務推理與規劃時,S0確保每個動作都能平穩、安全且穩定地執行。
S0并非為行走、轉向、蹲下或伸手等動作分別設計獎勵函數,而是直接從大量且多樣化的運動數據中學習追蹤人體動作。
Figure投喂了超過1000小時的關節級重定向人類運動數據,而S0則是在不斷的仿真模擬中,模仿這些人類的動作。
S0的出現,讓Figure03直接獲得了一種類似于人類「直覺」的能力。
S1
掌心長眼、觸覺通神,它能為你捏起一顆藥片
在最初的Helix中,S1只負責上半身控制,輸入也僅限于關節狀態和圖像。
而在Helix 02中,S1連接了全部傳感器,并直接控制整個機器人。
輸入,通過頭部攝像頭、掌心攝像頭、指尖觸覺傳感器,以及全身本體感知。
輸出,通過覆蓋整個機器人的關節級控制:包括雙腿、軀干、頭部、手臂、手腕以及每一根手指。
這種從感知到全身執行的一體化架構,讓S1能把機器人自身狀態與環境視為一個強耦合系統來整體推理。
如果說全身協同讓Figure03的行動有了「人樣兒」,那么手部操作的進化,則讓它真正具備了「干細活」的能力。
比如處理類似洗碗、幫老人拿藥這些家庭環境中極其細膩的任務,Helix02通過配合Figure03的新硬件,完美解決了這個問題。
其中,掌心攝像頭和觸覺傳感器是Figure 03帶來的新硬件能力。
掌心攝像頭在物體被頭部攝像頭遮擋時,提供關鍵的手內視覺反饋。
每個指尖內嵌的觸覺傳感器能檢測低至3克的力,靈敏到足以感知一枚回形針,從而實現具備接觸感知、可精細調節力度的抓取。
這些感知能力真正釋放了五指靈巧手的潛力,讓Helix能應對需要多指精細控制的復雜操作。
在演示中,我們看到了Figure 03在靈巧任務中令人驚嘆的場景:
任務1:擰開瓶蓋
Figure03必須在施加持續且受控的旋轉以擰下瓶蓋時,保持瓶子的穩定,同時避免打滑或壓碎容器。
這需要雙手協調配合,并通過觸覺調節握力與扭矩控制。
任務2:從藥盒中找出并取出藥片
Figure 03必須從藥盒中定位并取出一粒小藥片,而藥片常常被遮擋無法被頭部攝像頭看到。
任務3:從注射器中精確推出5毫升液體
這需要手掌級別的視覺反饋以及觸覺引導的精準抓取。
面對藥盒里細小且不規則的藥片,甚至是那些被遮擋的藥片,Figure03沒有絲毫猶豫。
Figure 03必須精確推進注射器活塞,以釋放指定體積的液體,這需要具備觸覺反饋的力控驅動,以及多指協同的穩定操作。
任務4:從雜亂的箱子中拾取金屬零件
Figure 03必須從一堆相互重疊、遮擋且在交互過程中會移動的物體中取出小型金屬部件。
這需要在雜亂環境中具備可靠的視覺抓取選擇能力,并通過觸覺確認抓取的穩固性。
在這些靈巧任務中,Figure03展示了完美的「分寸感」。
比如在擰瓶蓋任務中,它能實時感知摩擦力的變化,施加連續且可控的旋轉力。在處理注射器時,它更是能精確控制推注的體積。
這種指尖上的進化,意味著機器人終于可以勝任家庭場景的細膩任務,真正具備了「干細活」的能力。
這一切,都要歸功于S1。
它是一個「全傳感器輸入,全關節輸出」的強大視覺-運動策略層,它把眼睛看到的(頭部和掌心)、手指摸到的(觸覺傳感器)、身體感受到的(本體感知),全部融合成一個整體,以每秒200次的頻率指揮全身關節配合。
它讓機器人不再是「盲人摸象」,而是真正的「眼手心合一」。
S2:場景理解與語言
系統2仍然是語義推理層:處理場景、理解語言,并為S1生成潛在目標。
Helix 02大幅擴展了S2所能指定的行為范圍。
從以往「拿起番茄醬」這樣簡單操作,擴展到了一些更復雜的任務,比如走到洗碗機前并打開它、把碗端到臺面上、回到頂層架子,拿起杯子……
S2無需規劃底層的步態或具體指定如何協調手臂與腿部動作。
它生成一系列語義隱變量,由S1解釋為運動指令,并由S0執行。
自主長時程移動操作
得益于對S1、S2、S0在運動能力、推理、感知、靈巧性等方面能力的全面整合,Helix 02能夠執行連續的、持續數分鐘的任務。
我們看到了S0負責穩健的身體控制,S1負責敏捷的動作執行,而S2則負責理解我們那些復雜的指令。
以前我們需要給機器人寫代碼才能讓它動,現在,你只需要對它說:「把杯子放入洗碗機」。
S2會聽懂這句話,把它拆解成「走到水槽」「拿起杯子」「走到洗碗機」「放好」等一系列意圖;
S1會指揮手眼配合去抓杯子;S0則會確保在這個過程中,機器人不會因為踩到地上的水漬而滑倒。
如果說以前機器人是「計算」出來的平衡,現在機器人是「感覺」到了平衡。
它不再需要為每一個微小的動作寫說明書,而是把人類千萬年進化出來的「肌肉記憶」,直接裝進了自己的神經網絡里,真正實現了全身級自主控制。
這次Figure 03廚房秀,讓人突然意識到機器人開始有「身體直覺」了。
也許當它真正量產走進人類廚房時,那個「今天誰洗碗?」的難題可能將不復存在了。











