全球AI視覺領域迎來里程碑式進展——由DiT技術開創者謝賽寧團隊研發的“多人視頻世界模型”Solaris正式問世。這一突破性成果首次實現了虛擬場景中多角色協同感知與動態交互,標志著視頻生成技術從“單主體敘事”邁入“多主體共生”的新紀元。在《我的世界》實測環境中,該模型成功支撐8名玩家同時進行建筑協作,畫面連續性指標較前代方案提升67%,徹底解決了多人交互場景中的視覺崩塌難題。
技術架構層面,Solaris創新性植入“多人自注意力機制”,通過動態構建玩家間信息交換網絡,實現毫秒級響應的協同感知。研發團隊基于昆侖天工2025年開源的Matrix-Game2.0框架進行深度優化,重點攻克了空間坐標對齊、動作序列同步等關鍵技術瓶頸。實驗數據顯示,在30分鐘持續交互測試中,模型維持98.7%的場景一致性,較傳統方案提升3.2倍,為開放世界游戲、元宇宙社交等場景奠定技術基石。
資本市場的熱烈反響印證了技術價值。由圖靈獎得主楊立昆領銜的AMI公司憑借該成果完成10.3億美元種子輪融資,創下AI領域初創企業融資紀錄。這家總部位于巴黎的科技新銳,自2026年1月成立以來便聚焦多模態交互技術研發,其估值在短短兩個月內飆升至35億美元。作為聯合創始人兼首席科學官,謝賽寧正帶領200人研發團隊推進模型輕量化改造,目標將推理延遲壓縮至80毫秒以內。
開源戰略成為技術普及的關鍵推手。研發團隊同步開放Solaris核心代碼庫與預訓練模型,提供從數據預處理到場景部署的全流程工具包。全球開發者現已基于該框架開發出虛擬演唱會、遠程協作手術等200余個應用場景。值得注意的是,特斯拉、英偉達等科技巨頭已啟動技術對接,探索將模型應用于自動駕駛仿真訓練與機器人群體協作領域。
這項突破正在重塑數字內容生產范式。傳統視頻生成依賴單一視角敘事,而Solaris通過解耦個體行為與場景演化,使創作者能夠像導演般操控多個虛擬角色。在實測演示中,系統同時生成8個角色進行圍棋對弈、舞蹈編排等復雜交互,畫面流暢度達到4K/60幀標準。技術專家指出,該成果為構建“數字孿生社會”提供了關鍵基礎設施,可能催生萬億級虛擬經濟市場。











