京東探索研究院近日宣布,其自主研發的圖像編輯模型JoyAI-Image-Edit正式面向全球開源。這款以“空間智能”為核心特性的模型,首次將AI修圖技術從二維平面處理推向三維空間建模領域,為計算機視覺領域帶來突破性進展。通過深度融合物理空間規律,該模型實現了對真實場景的幾何一致性編輯,標志著AI對空間關系的理解達到新高度。
在技術實現層面,模型構建了覆蓋相機參數、物體運動軌跡等多維度的物理引擎。開發者可直接調用推理接口,在保持場景結構完整性的前提下,對空間元素進行精準操作。其獨創的自然語言交互系統支持通過文本指令調整相機視角,包括偏航角、俯仰角及縮放比例等參數,解決了傳統模型在空間理解方面的技術瓶頸。
該模型的創新性體現在動態空間編輯能力上。通過連續視角移動算法,可生成具有邏輯連貫性的漫游視頻序列。在保持整體場景穩定的同時,支持對指定物體進行獨立縮放或位移操作,并自動計算光影變化與遮擋關系,確保編輯結果的視覺真實性。這種動態空間處理能力在虛擬場景構建、3D內容生成等領域具有重要應用價值。
功能擴展性方面,模型整合了15類主流圖像編輯需求,包括物體增刪、材質替換、風格遷移等通用功能。其模塊化設計支持開發者根據具體場景進行功能組合,既可實現基礎圖像優化,也能完成復雜的三維場景重建。這種技術架構使其在電商產品展示、數字創意設計、機器人環境感知等多個領域展現出強大適應性。
目前,該模型已在多個行業實現落地應用。在電商領域,通過三維空間編輯技術可快速生成多角度商品展示圖,顯著提升內容制作效率;創意設計行業利用其動態視角生成功能,開發出新型交互式視覺作品;具身智能領域則借助空間理解能力,為機器人提供更精準的環境感知支持。這些實踐驗證了模型在跨行業技術賦能方面的有效性。









