“AI教母”李飛飛參與創(chuàng)立的初創(chuàng)公司World Labs近日宣布完成新一輪10億美元融資,投資者陣容包括芯片行業(yè)巨頭英偉達、AMD,知名投資機構A16Z以及軟件企業(yè)歐克特等。這家公司此前在隱身模式運營一年多后,已獲得2.3億美元初始資金,此次再度獲得資本青睞,引發(fā)業(yè)界對空間智能技術的高度關注。
李飛飛團隊的核心突破在于將傳統(tǒng)二維視覺認知升級為三維空間理解。其推出的商業(yè)產品Marble通過輸入照片、視頻、文字描述或3D草圖,即可生成可編輯、可導出的完整虛擬世界。該模型突破了傳統(tǒng)視頻生成工具的局限,不僅支持精確的攝像機控制,還能呈現(xiàn)物體背面和底部的細節(jié),并搭載高斯?jié)姙R技術確保視覺真實性與幾何信息并存。
在應用場景中,Marble展現(xiàn)出強大的創(chuàng)作能力。以客廳照片為例,系統(tǒng)能自動還原沙發(fā)位置、窗戶光線等物理特征,生成可360度觀察的場景。盡管邊緣處理仍存在優(yōu)化空間,但整體效果已達到實用標準。該系統(tǒng)特別設計的Chisel三維編輯器,允許用戶通過結構搭建與文字描述相結合的方式生成場景——輸入“奶酪房間配葡萄座椅”等指令,系統(tǒng)會自動填充視覺細節(jié),這種結構與風格分離的設計理念借鑒了網頁開發(fā)的分層模式。
針對大型場景需求,Marble開發(fā)了場景擴展功能。當用戶接近場景邊界時,系統(tǒng)可自動生成銜接環(huán)境;通過作曲家模式,還能將多個獨立場景無縫拼接。這些特性使其區(qū)別于傳統(tǒng)實時渲染的世界模型,生成的三維環(huán)境具有持久性,可導出為標準文件格式,直接接入游戲引擎或VR設備進行二次創(chuàng)作。
李飛飛將這項技術定義為“空間智能”,認為其與大語言模型形成互補:前者賦予機器觀察與建造能力,后者側重閱讀與寫作。她指出,當機器理解物體在三維空間的互動規(guī)律,其應用將突破娛樂領域,深入科學研究和醫(yī)療實踐。這種技術愿景與圖靈獎得主楊立昆的研究路徑形成鮮明對比——后者專注開發(fā)預測式世界模型,強調在抽象空間中學習物理規(guī)律,更適用于機器人控制與因果推理。
兩位頂尖科學家的分歧體現(xiàn)在技術路徑選擇上。李飛飛體系追求高保真視覺呈現(xiàn)與創(chuàng)作自由度,通過生成持久性三維環(huán)境服務虛擬制作;楊立昆方案則側重底層邏輯建模,通過預測世界變化規(guī)律提升機器人決策能力。這種差異本質上是視覺導向與認知導向的技術路線之爭。
在近期訪談中,李飛飛從哲學層面闡釋了技術命名初衷。她認為世界既包含物理空間的幾何規(guī)則,也涵蓋思維層面的邏輯流動。這種雙重定義貫穿其技術理念——在開發(fā)Marble時,團隊始終將人類尊嚴置于核心位置,強調AI應作為創(chuàng)作者、醫(yī)療工作者的輔助工具,而非替代者。這種技術倫理觀,與其推動空間智能發(fā)展的目標形成有機統(tǒng)一。











