2 月 9 日消息,Alphabet 旗下自動駕駛技術(shù)企業(yè) Waymo 當(dāng)?shù)貢r間本月 6 日宣布推出其世界模型。這一模型基于其兄弟企業(yè)谷歌旗下 DeepMind 的通用世界模型 Genie 3 打造,可生成逼真且交互式的 3D 環(huán)境。
Waymo 表示,自動駕駛行業(yè)的大多數(shù)仿真模型都是基于收集到的道路數(shù)據(jù)從 0 開始訓(xùn)練的,這意味著上述模型缺乏對一些極其罕見的超常規(guī)事件的信息,難以應(yīng)對龍卷風(fēng)、大象、風(fēng)滾草、恐龍頭套 Cosplay 等異常罕見事件。
而谷歌 Genie 3 為 Waymo 的世界模型提供了廣泛的知識基礎(chǔ),Waymo 又在此基礎(chǔ)上通過后訓(xùn)練將海量 2D 視頻信息轉(zhuǎn)化為 Waymo 自動駕駛硬件支持的 LiDAR 激光雷達信號,讓該模型幾乎可以生成任何場景。
Waymo 世界模型通過三種主要機制實現(xiàn)了強大的模擬控制能力,即駕駛動作控制、場景布局控制、語言控制(注:這里指在基礎(chǔ)生產(chǎn)內(nèi)容上的各種環(huán)境背景變化調(diào)整)。在基礎(chǔ)版本之外,Waymo 世界模型還有支持更長時間模擬的更高效變體。















