京東探索研究院近日宣布,其自主研發的圖像模型JoyAI-Image-Edit正式開源,這一創新成果標志著AI技術在三維空間編輯領域取得重大突破。該模型首次將空間智能深度融入圖像生成與編輯流程,使AI能夠精準理解并操作三維空間,而非局限于傳統的平面圖像處理。
傳統圖像模型在處理空間邏輯時往往存在混亂,例如物體移動后出現變形、遮擋關系錯誤或光影不自然等問題。JoyAI-Image-Edit通過構建完整的空間理解數據與任務體系,從空間位置、多視角一致性、相機感知到場景推理等多個維度進行全面建模,成功解決了這些行業難題。實驗數據顯示,該模型在物體移動精度和空間一致性等核心指標上已達到世界領先水平。
該模型的核心優勢在于其三大空間編輯能力:視角變換功能允許用戶通過自然語言指令調整相機角度,生成符合幾何規律的新視角圖像;空間漫游功能支持連續視角移動,可生成邏輯連貫的多視角圖像序列;物體空間關系操控功能則能在保持場景整體結構穩定的前提下,對特定物體進行位移、縮放等操作,同時確保遮擋與光影關系自然合理。這些能力使AI在編輯圖像時能夠穩定保持主體形象與場景結構的完整性。
除了空間編輯能力的突破,JoyAI-Image-Edit還全面兼容15類通用編輯功能,包括物體替換、刪除、添加、風格遷移和細節精修等,覆蓋了內容創作的高頻需求。結合其頂尖的空間編輯技術,該模型在長文本精準渲染、多視角一致性生成等復雜任務中表現出色,能夠滿足全場景、無死角的高效創作需求。
這一成果的應用前景廣闊,可廣泛應用于電商內容生產、創意設計制作、智能圖像處理、3D模型重建以及具身智能視覺感知等領域。特別是在具身智能領域,空間理解能力是機器人感知和交互世界的基礎,JoyAI-Image-Edit的推出為相關技術研發提供了關鍵的底層支持,有望推動AI技術在更復雜的現實場景中落地應用。







