“AI教母”李飛飛參與創立的初創公司World Labs近日宣布完成新一輪10億美元融資,投資者陣容包括芯片行業巨頭英偉達、AMD,知名投資機構A16Z以及軟件企業歐克特等。這家公司此前在隱身模式運營一年多后,已獲得2.3億美元初始資金,此次再度獲得資本青睞,引發業界對空間智能技術的高度關注。
李飛飛團隊的核心突破在于將傳統二維視覺認知升級為三維空間理解。其推出的商業產品Marble通過輸入照片、視頻、文字描述或3D草圖,即可生成可編輯、可導出的完整虛擬世界。該模型突破了傳統視頻生成工具的局限,不僅支持精確的攝像機控制,還能呈現物體背面和底部的細節,并搭載高斯潑濺技術確保視覺真實性與幾何信息并存。
在應用場景中,Marble展現出強大的創作能力。以客廳照片為例,系統能自動還原沙發位置、窗戶光線等物理特征,生成可360度觀察的場景。盡管邊緣處理仍存在優化空間,但整體效果已達到實用標準。該系統特別設計的Chisel三維編輯器,允許用戶通過結構搭建與文字描述相結合的方式生成場景——輸入“奶酪房間配葡萄座椅”等指令,系統會自動填充視覺細節,這種結構與風格分離的設計理念借鑒了網頁開發的分層模式。
針對大型場景需求,Marble開發了場景擴展功能。當用戶接近場景邊界時,系統可自動生成銜接環境;通過作曲家模式,還能將多個獨立場景無縫拼接。這些特性使其區別于傳統實時渲染的世界模型,生成的三維環境具有持久性,可導出為標準文件格式,直接接入游戲引擎或VR設備進行二次創作。
李飛飛將這項技術定義為“空間智能”,認為其與大語言模型形成互補:前者賦予機器觀察與建造能力,后者側重閱讀與寫作。她指出,當機器理解物體在三維空間的互動規律,其應用將突破娛樂領域,深入科學研究和醫療實踐。這種技術愿景與圖靈獎得主楊立昆的研究路徑形成鮮明對比——后者專注開發預測式世界模型,強調在抽象空間中學習物理規律,更適用于機器人控制與因果推理。
兩位頂尖科學家的分歧體現在技術路徑選擇上。李飛飛體系追求高保真視覺呈現與創作自由度,通過生成持久性三維環境服務虛擬制作;楊立昆方案則側重底層邏輯建模,通過預測世界變化規律提升機器人決策能力。這種差異本質上是視覺導向與認知導向的技術路線之爭。
在近期訪談中,李飛飛從哲學層面闡釋了技術命名初衷。她認為世界既包含物理空間的幾何規則,也涵蓋思維層面的邏輯流動。這種雙重定義貫穿其技術理念——在開發Marble時,團隊始終將人類尊嚴置于核心位置,強調AI應作為創作者、醫療工作者的輔助工具,而非替代者。這種技術倫理觀,與其推動空間智能發展的目標形成有機統一。











