谷歌近日突然宣布,其備受矚目的通用世界模型Genie 3正式開啟公測。這一消息引發(fā)全球科技圈的廣泛關(guān)注,網(wǎng)友紛紛驚嘆“仿佛進(jìn)入黑客帝國”。此次公測面向美國GoogleAIUltra訂閱用戶開放,且限定18歲以上人群參與。
Genie 3的誕生與一場“倒逼”密切相關(guān)。就在谷歌宣布消息的前一天,螞蟻靈波推出的世界模型LingBot-World上線即成為行業(yè)標(biāo)桿,這一成果讓谷歌感受到不小的壓力。事實上,谷歌早在去年8月就預(yù)告了Genie 3,但此后一直未有實質(zhì)性進(jìn)展,直到此次被中國AI力量“刺激”后才加速推進(jìn)。
Genie 3的核心能力在于其動態(tài)交互性。與傳統(tǒng)的靜態(tài)3D場景不同,它能根據(jù)用戶的行動實時生成環(huán)境——用戶向前走,道路便隨之出現(xiàn);改變行動方式,世界布局也會相應(yīng)調(diào)整。這種特性使其在機(jī)器人訓(xùn)練、動畫制作、小說創(chuàng)作等領(lǐng)域展現(xiàn)出巨大潛力,甚至能模擬真實地點或歷史場景。
技術(shù)層面,Genie 3與谷歌Nano Banana Pro和Gemini深度集成,形成一個網(wǎng)頁應(yīng)用。用戶可通過三個步驟體驗其功能:首先用文字和視覺提示詞設(shè)計世界和角色;接著由Nano Banana Pro生成可調(diào)整的圖像預(yù)覽;最后,Genie 3在用戶移動時實時生成環(huán)境。用戶還能在畫廊中混搭現(xiàn)有世界或創(chuàng)造全新場景。
首批體驗者對Genie 3的評價褒貶不一。a16z合伙人Justine Moore測試后表示,該模型在物理規(guī)則、記憶能力和控制方式上表現(xiàn)出色。例如,角色無法穿透實體物體或打開關(guān)閉的門,且能記住用戶離開前的場景細(xì)節(jié)。然而,其記憶功能并非完美,偶爾會出現(xiàn)內(nèi)容丟失的情況。沃頓商學(xué)院教授Ethan Mollick則展示了更復(fù)雜的實驗——他創(chuàng)造了一個“遞歸世界”,其中角色頭部的顯示屏實時運行另一個《毀滅戰(zhàn)士》,而該游戲中的角色頭部又是一塊顯示屏,形成無限嵌套的視覺效果。
游戲領(lǐng)域是Genie 3最受矚目的應(yīng)用場景。網(wǎng)友GrandDiTwo用其制作了人生首個AI視頻游戲,并拋出疑問:“游戲產(chǎn)業(yè)的末日到了嗎?”盡管當(dāng)前版本仍存在缺陷,但用戶已能通過提示詞生成《塞爾達(dá)傳說》《刺客信條》等經(jīng)典游戲的模擬場景。例如,有人僅用《塞爾達(dá)傳說:曠野之息》的素材,便生成了包含開闊草原、層次地形和光影變化的3D世界,效果令人驚嘆。
Genie 3的“重生”機(jī)制也引發(fā)討論。當(dāng)用戶角色掉入深淵時,系統(tǒng)會直接將其傳送到新地點,而非結(jié)束游戲。這種設(shè)計讓體驗更具連續(xù)性,但也引發(fā)關(guān)于游戲規(guī)則邊界的討論。用戶還能通過自然語言修改草圖,例如保留草原世界但更換探索角色,進(jìn)一步拓展了創(chuàng)作自由度。
隨著公測開啟,科技界開始對比不同技術(shù)路徑。除Genie 3外,李飛飛的團(tuán)隊也在開發(fā)3D世界模型Marble,后者能生成永久存在的明確世界,用戶可隨時返回且場景保持一致。兩條路徑各有優(yōu)勢:Genie 3適合短時探索,Marble則更適合長期沉浸式體驗。用戶可根據(jù)需求選擇合適工具。
目前,Genie 3的公測仍在持續(xù),谷歌CEO劈柴試玩后稱其“感覺棒極了”。盡管該模型仍處于早期階段,但已展現(xiàn)出顛覆傳統(tǒng)創(chuàng)作模式的潛力。隨著用戶反饋的積累,其功能有望進(jìn)一步完善,而關(guān)于AI生成內(nèi)容與版權(quán)保護(hù)的爭議,也可能隨之浮出水面。










