AIPress.com.cn報道
1月30日消息,Google DeepMind 宣布推出一項名為 Project Genie 的實驗性研究原型,展示其最新“世界模型”人工智能在生成和探索交互式虛擬環境方面的能力。相關信息發布于 Google 創新與 AI 官方博客。
Project Genie 基于 Genie 3 驅動。Genie 3 是一款通用世界模型,可根據簡單的文本或圖像提示生成可探索的虛擬世界,并在用戶移動和操作時實時演化。生成內容包括地形、角色及環境元素,且能夠對用戶行為作出動態響應。
該項目是 Google 在先進 AI 系統研究中的一部分,目標是推動生成式 AI 從靜態文本和圖像,邁向具備持續性與交互性的“世界級”生成能力。官方介紹稱,這些模擬環境可涵蓋沙漠、森林等自然場景,也可擴展至復雜生態系統或幻想世界,均由用戶描述直接生成。
Google 表示,將向美國地區的 Google AI Ultra 訂閱用戶開放 Project Genie 的使用權限,供其體驗和測試相關世界生成能力。
Genie 3 于 2025 年首次公布,被視為世界模型研究的重要進展。與早期只能短時間維持一致性的場景生成系統不同,Genie 3 能在數分鐘的探索過程中保持環境邏輯與連續性。
在更廣泛的行業背景下,Project Genie 的推出正值生成式 AI 競爭加劇之際。包括 OpenAI、meta 在內的多家公司,均在推進支持動態內容和復雜環境構建的 AI 系統。研究人員普遍認為,世界模型是邁向更通用人工智能的重要技術路徑之一。
AI 行業近期也在加大對“空間智能”的投入,即讓 AI 理解、生成并推理三維空間環境。此前,World Labs 推出的多模態世界模型 Marble,同樣聚焦于讓 AI 在可導航的三維場景中進行感知與交互,顯示出該方向正在成為研究熱點。(AI普瑞斯編譯)
















