谷歌旗下DeepMind團隊近日公布了一項名為Project Genie的實驗性研究項目,該原型系統通過新一代"世界模型"技術,實現了交互式虛擬環境的動態生成與實時演化。這項突破性成果已通過谷歌創新與人工智能官方博客對外發布,標志著生成式人工智能向三維空間交互領域邁出關鍵一步。
支撐Project Genie的核心技術是Genie 3世界模型,其突破性在于能夠根據文本或圖像輸入,自動構建包含地形、生物及環境要素的完整虛擬世界。與傳統生成系統不同,該模型不僅支持用戶自由探索,還能實時響應用戶操作,在數分鐘持續交互過程中保持環境邏輯的連貫性。例如當用戶移動角色或改變場景元素時,系統會自動調整光照、物理效果等環境參數。
作為谷歌人工智能研究的重要布局,Project Genie的研發目標直指"世界級"生成能力。相較于靜態文本圖像生成,該系統可創建從沙漠戈壁到奇幻森林的多樣化場景,甚至能模擬復雜生態系統。所有環境參數均通過自然語言描述直接生成,用戶無需掌握專業建模技能即可創建個性化虛擬空間。
目前該項目已啟動封閉測試,美國地區的谷歌AI Ultra訂閱用戶將率先獲得體驗資格。測試階段重點驗證系統在長時間交互中的穩定性,以及不同類型用戶輸入的響應精度。開發團隊透露,后續版本將增加多用戶協作功能,支持多個參與者同時在同一虛擬世界中互動。
在技術競爭層面,Project Genie的推出恰逢生成式AI領域的關鍵轉折點。OpenAI、meta等科技巨頭均在研發支持動態環境構建的AI系統,而"世界模型"技術被普遍視為通向通用人工智能的重要路徑。值得關注的是,近期行業對"空間智能"的投入顯著增加,這類技術旨在賦予AI理解三維空間關系的能力。
此前由World Labs開發的多模態模型Marble已展現出類似潛力,該系統允許AI在可導航的三維場景中執行感知與決策任務。隨著谷歌、meta等公司持續加碼空間計算領域,虛擬環境生成技術正從實驗室走向實際應用場景,可能對游戲開發、數字孿生、遠程協作等行業產生深遠影響。

















