谷歌再次在人工智能領域掀起波瀾,其旗下DeepMind團隊推出的世界模型Genie 3實驗性研究原型「Project Genie」正式向公眾開放。這一創新項目允許用戶創建、編輯并探索虛擬世界,標志著交互式環境生成技術邁入新階段。
作為通用世界模型Genie 3的延伸,Project Genie整合了圖像生成與編輯模型Nano Banana Pro和語言模型Gemini的技術優勢。用戶可通過文本描述或上傳圖片創建動態環境,定義角色行為模式——從步行、騎行到飛行均可實現。系統特別引入"世界草繪"功能,允許用戶在進入虛擬場景前預覽并調整視覺效果,甚至切換第一人稱或第三人稱視角。
該平臺的核心突破在于實時路徑生成技術。當用戶移動角色時,系統會根據交互行為動態延伸場景,這種突破性的一致性使機器人訓練、動畫制作乃至歷史場景重建成為可能。目前開放的功能包含三大模塊:環境創建、交互探索和內容重混。用戶既能從零構建虛擬世界,也可基于現有作品進行二次創作,最終生成的視頻內容支持下載保存。
首批體驗的Google AI Ultra用戶已展示出驚人創造力。有人構建出"法國女子攀越非邏輯世界"的奇幻場景,墻壁漂浮著飛行物體;另有用戶嘗試讓系統運行經典游戲《毀滅戰士》,創造出嵌套式的屏幕迷宮。這些作品雖然存在物理模擬瑕疵——比如水獺飛行員頭頂鴨子、角色開門動作略顯僵硬——但已展現出技術潛力。
項目團隊坦言當前版本存在局限性:生成內容時長限制在60秒內,部分預設功能如"提示事件"尚未開放,角色控制偶發延遲。但這些不足并未削弱技術社區的熱情,用戶在社交平臺分享的創作視頻已引發廣泛討論。隨著更多用戶參與測試,這個專注于沉浸式世界構建的平臺有望持續進化,重新定義數字內容的創作方式。











