當雙足機器人TRON 1被搬進辦公室的瞬間,這個全身僅依靠兩條機械腿支撐的金屬生命體,立即引發了技術團隊的集體圍觀。盡管團隊成員早已見慣各類四足機器人與人形設備,但這種將所有運動能力集中于雙腿的極簡構型,仍讓所有人屏息凝神——畢竟,讓兩條腿在真實世界中保持平衡行走,遠比想象中復雜得多。
這款由逐際動力研發的機器人,每條腿配備三個高精度電機,通過六個關節的協同運動實現動態平衡。相較于擁有數十個關節的復雜人形機器人,TRON 1的極簡設計使其成為研究雙足運動規律的理想平臺。技術團隊選擇從最基礎的行走訓練入手,試圖揭開機器人步態控制的奧秘。
訓練過程始于虛擬仿真環境。在Isaac Gym構建的數字空間里,上千個機器人同時進行運動測試,這種并行計算模式將傳統需要數月的訓練周期壓縮至數小時。強化學習算法PPO在此發揮關鍵作用,通過18個精心設計的獎懲函數引導機器人學習:三個正向獎勵對應站穩、定向移動等基礎動作,其余十五項懲罰機制則嚴格約束雙腿間距、著地角度等細節參數。
虛擬訓練很快取得突破,僅用三小時,機器人便掌握了穩定直線行走的能力。但當技術團隊將訓練好的模型導入實體機器人時,理想與現實的鴻溝驟然顯現。真實環境中的地面摩擦系數變化、傳感器延遲、重心動態偏移等因素,導致虛擬世界中完美的步態算法在現實里頻繁失效。機器人時而雙腿抽搐,時而突然跌倒,甚至發出刺耳的機械摩擦聲,嚇得團隊成員的金毛犬躲進角落。
經過反復調試,技術團隊發現問題的根源在于算法過擬合。虛擬環境中的理想參數在真實世界中變得脆弱不堪,任何細微的環境變化都會引發連鎖反應。工程師Brandon指出,這恰是具身智能領域的核心挑戰——如何讓數字模型具備適應復雜物理世界的魯棒性。為此,團隊不得不重新調整獎懲機制,在模型中引入隨機擾動訓練,增強算法的泛化能力。
當機器人最終實現邊跳躍邊前進的復雜動作時,這個看似簡單的成果背后,是數十次模型迭代與上百小時的實體測試。技術團隊坦言,公眾看到的機器人表演視頻,往往只展示成功瞬間,而掩蓋了背后海量的失敗數據。每個流暢動作的背后,都包含著傳感器校準、電機控制、動力學建模等數十個環節的精密配合。
盡管當前雙足機器人的應用場景仍顯有限,但逐際動力團隊強調其科研價值。TRON 1這類極簡構型機器人,通過降低實驗成本與迭代周期,為研究雙足運動規律提供了高效平臺。團隊演示了機器人如何在模擬滅絕恐龍行走、危險環境探測等場景中發揮作用,這些應用雖不驚艷,卻驗證了底層技術的可行性。
更深遠的意義在于技術積累。從早稻田大學WABOT花費數年實現基礎行走,到如今非專業工程師在24小時內完成步態訓練,雙足機器人技術的發展速度已超越人類進化歷程。當技術團隊調侃"現在嚇哭的是狗,未來可能是人類"時,他們更想傳遞的是:每個看似笨拙的機械動作,都在為更智能的機器人時代鋪路。這些金屬生命體的每一次跌倒與爬起,都在改寫著人類對機器運動的認知邊界。











