滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

對話自變量CTO王昊：具身智能的“圣杯”為什么是家庭？

時間：2026-04-04 01:58:42 來源：鳳凰網科技編輯：快訊 IP：北京 發表評論無障礙通道

作者 Dale

編輯董雨晴

“家庭確實是具身智能的圣杯?！?026年3月30日上午，深圳零一學院，自變量機器人聯合創始人兼CTO王昊在包括鳳凰網科技在內的一場訪談中給出了這個判斷。彼時正值首屆具身智能開發者大會（EAIDC 2026）舉辦期間，進入決賽的20支頂尖隊伍在此集結，參賽者只有三天時間從零完成數據采集、模型訓練到真機部署的全流程。

在幾乎所有同行都在優先拿下工業場景訂單的2026年，自變量選擇了一條更具冒險性的道路。今年3月，自變量宣布與58同城合作，由58到家平臺隨機調度阿姨與機器人組成搭檔，共同進行家政服務，已在深圳開啟試點。家庭，這個標準化程度最低、環境最開放的場景，正在成為自變量心中“通往通用機器人”的關鍵戰場。

01 一場把機器人拉回真實世界的比賽

本次EAIDC 2026的賽制設計頗有玄機，所有參賽隊伍使用同一套硬件平臺，三天之內從初次接觸具身智能基座模型及真機調試的狀態，完成從數據采集到真機部署的全流程。通常情況下，專業研究實驗室完成類似搭建至少需要6個月。

在王昊的觀察中，比賽開始的第一天下午就出現了顯著分化?！暗谝惶煜挛玳_營，到了晚上有的選手還在調試環境，有的選手已經有成績了，這是很大的差別?！焙髞硭l現，那些頻繁評測、仔細觀察數據和硬件的團隊，相比不動手的選手更加突出?！罢麄€具身是交互學習，讓機器在測試、以及人對它的觀察中找到問題，越有可能找到真正物理世界復雜性的解法?！?/p>

一位參賽選手后來回憶，他們在最初面對“將環套在柱子上”的任務時，成功率只有20%到30%，經過不斷迭代才逐步提升至60%到70%。

比賽還設置了A榜和B榜——A榜環境可控，供選手快速驗證模型能力；B榜則是完全黑盒，考驗模型在光照、背景、操作對象和操作位置變化下的泛化能力。王昊說，這是他們做比賽的初衷：“想通過這次比賽真正讓整個開源項目可以降低對開發者的使用門檻，建立一個相對比較通用和標準的接口”。

在長期依賴仿真評測的具身智能行業，仿真環境雖然可以加速迭代，卻難以還原真實世界的復雜性，sim2real（指從模擬環境到現實世界的技術遷移方法）的差距始終存在。王昊坦言：“長期依賴仿真評測，不可避免會掩蓋模型能力的真實邊界”。而EAIDC這場“真機演武場”，試圖將評測、訓練和數據采集三者重新拉回到同一個真實世界中。

02 端到端的“新故事”？

自變量從一開始就選擇了“大小腦統一的端到端大模型”路線。在技術架構上，團隊正嘗試將世界模型與VLA（視覺-語言-動作）模型融合在一個聯合框架下。

王昊解釋了這個路線的底層邏輯?！按笳Z言模型這個訓練基礎還是要用，只是我們要把語言、動作拉到一個空間當中，而不是像以前那樣讓所有視覺都服務于語言。”語言描述的信息很宏觀，而物理世界的交互發生在厘米級和秒級尺度上，兩者之間存在巨大的信息鴻溝?！叭绻覀兡懿捎迷嗄B的方式，動作可以同時在宏觀和微觀上都有非常清晰的表現，它能把視覺從以前靜態的觀察變成讓視覺理解運動?！?/p>

這與當前不少VLA模型的簡化設計形成對比。有行業觀察者指出，許多具身模型仍偏向簡化，多數VLA模型仍依賴單幀圖像輸入。

王昊認為，端到端模型最大的挑戰在于訓練復雜度和規模要求。“如果沒有具備這兩個條件，你選擇端到端不一定有選擇垂類小模型或分層模型的效果好。端到端意味著必須要有規模效應，數據量、模型參數量要上去。”具身智能的評測也比語言大模型更棘手，“語言大模型可以看loss曲線，對具身來說往往不是這樣，loss不能反映你在真實世界的表現，因為真實世界是閉環的系統。”

自變量的另一個核心策略是堅持真實世界的真機數據采集。王昊說，所有交互式學習和強化學習，最重要的數據都來自真機，“這個數據采集不會停，還會繼續做。”但他也透露，2026年會有一個大的變化——“越來越依賴于人的穿戴式或Ego-Centric的方式采集數據”。

03 為什么是家庭？

事實上，業內人士普遍判斷家庭場景成熟應用需要等待5到10年，多數廠商在商業化上更傾向于工業場景——環境可控、任務單一、ROI可核算。2026年初，一批估值百億的機器人公司涌現，而在家庭服務這個方向上，目前尚無真正意義上的成熟玩家。

王昊給出了不同的解題思路：“家庭代表最開放的環境和最廣泛的任務，解決了家庭任務，就代表模型可以實現完全泛化。只有一開始就直面最復雜的場景，才能提升模型的智能化水平。不管從什么時候開始，越早開始越好，這是最重要的?！?/p>

然而，進入家庭有幾個關鍵難點。一是零樣本泛化能力——模型必須通過推理探索成功路徑，而非依靠預先訓練?！斑M入家庭一開始沒有多少機會訓練模型，這時候需要激發模型的推理能力，讓它在家庭場景中通過推理探索出成功的例子。”二是長程操作的精細度?！艾F在基模進入家庭，在很多任務上有完成的趨勢或動作意圖，比如可以在任何物體上有伸過去抓它的趨勢，但精細度不夠，導致復雜長程任務時錯誤累積就會失敗?！?/p>

王昊介紹，解決長程精細度問題有兩個關鍵。第一是激發模型的推理能力，“讓語言結合視覺進行推理，語言、視覺、動作在同一個水平下形成思維鏈，讓機器人自己規劃和反思?！钡诙窃诖笠幠Ｕ鏅C情況下做強化學習，“保持在基模標準下達到更高標準的空間精度?！?/p>

王昊預估“普通清潔、收納這類任務，可以在1到2年時間實現完全自主。但要在所有家庭任務中實現閉環，時間可能要再長一點。”

這與自變量CEO王潛的表述形成呼應。王潛曾在采訪中提到，今年內就能看到機器人以正ROI的方式實現商業化落地。而家庭場景的推進節奏顯然更慢，但也更長遠。

回到當下具身智能賽道最關心的爭議性話題，技術路線選擇與商業化孰輕孰重？

“在具身這個事情上，為了商業而犧牲技術而取得的成績天花板不會高，真正高的天花板是商業與技術協同，由技術逐步推動商業的發展?！蓖蹶徽J為，自變量的主線是讓基模不停向前迭代，“但有一點，不要在垂直場景做太多模型系統，為了落地而做很多工程上的彌補。比如發現機器人在視覺上有盲區，就搞一個小模型來檢測。短期來看可以幫助加快落地，但長期來看對基模的提升是危害的?！?/p>

這種堅持對應著自變量在場景選擇上的邏輯——選場景的第一個依據是看它能否反哺基模能力?！安皇钦f你先把技術做到完全泛化，再去考慮場景。恰恰相反，場景給你迭代，迭代讓基模更強，更強的基模再反哺商業，才能形成完整的閉環。”

他透露，做基礎模型的投入一直很高，公司從成立第一天起就在數據、算力和基礎設施上大規模投入?！耙坏┙⒁幠；?，當你投入10倍資源取得領先的時候，資源聚集效應會越來越明顯，你會以數量級的優勢在速度上超越別人。越早開始越有優勢，越晚開始就越難做成?！?/p>

04-04

北京市新增15款已完成登記的生成式人工智能服務

04-04

太空算力產業協同新篇章開啟 “太空算力專業委員會”正式成立

04-04

國星宇航太空算力獲突破：全球首驗AI操控地面機器人，發布企業云平臺

04-04

極豆科技攜手銀聯智譜嵐圖全球首秀車載智能體支付場景開啟出行服務新體驗

04-04

北京市新增15款已登記生成式人工智能服務

04-03

英偉達H100算力租賃價格漲約40%

04-03

北京市截至2026年4月3日新增15款生成式AI服務完成登記

04-03

AI演員入場：內容行業變革加速，機遇、挑戰與未來何去何從？

04-03

耀速科技A輪融資超2億，加速構建生物智能體系與推進監管認可進程

04-03

AI演員入場：是行業變革新引擎，還是挑戰與爭議并行？

04-03

中電信人工智能科技公司獲兩大基金入股注冊資本增至約33.7億

04-03

上海生成式AI服務再擴容新增7款備案產品累計達157款

04-03

太空算力產業協同平臺成立，我國太空算力發展邁向協同化新征程

04-03

GDPS2026：SAIA攜手KPMG 共繪傳統企業AI轉型新藍圖

04-03

點擊查看更多 +

全站最新

因湃電池攜新品亮相儲能峰會，車企布局電池賽道前景幾何？

燃油車智能化新突破！第四代博越L小藍燈版15萬內享高階智駕

比亞迪雙車齊發：閃充破局純電焦慮，長續航插混開啟實用新篇

新款大眾開迪官圖發布！外觀微調配側滑門動力涵蓋柴汽油與插混

吉利銀河M7中級電混SUV本月開啟預售，續航強勁配置豐富亮點多

AI賦能建材革新！京東攜手眾品牌發布新品，共筑智慧家居新未來

熱門內容

本欄最新

極豆科技攜手銀聯智譜嵐圖全球首秀車載智能體支付場景開啟出行服務新體驗

某大廠AI負責人離職：從共苦到同甘幻滅，職場“封建病”該治了

AI浪潮下企業破局之道：以組織重構為鑰，解鎖人機協同新未來

別克至境E7實車到店！大五座插混SUV 續航超長舒適配置拉滿

華為“克制”布局AI賽道：以硬件為基，聚焦核心，筑牢生態護城河

從“馬燈精神”到“東方風韻”：東風汽車以設計驅動駛向全球新航道

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

對話自變量CTO王昊：具身智能的“圣杯”為什么是家庭？

對話自變量CTO王昊：具身智能的“圣杯”為什么是家庭？