京東探索研究院近日宣布,其自主研發的圖像編輯模型JoyAI-Image-Edit正式開源,為AI圖像處理領域帶來突破性進展。該模型首次將"空間智能"理念深度融入技術架構,使AI突破傳統平面修圖局限,實現三維空間層面的精準理解與編輯,相關推理代碼已完全開放供開發者使用。
通過構建空間位置關系、多視角一致性、相機感知等核心模塊,該模型在相機坐標變換、物體空間位移、幾何結構控制等關鍵技術上取得突破。經實測驗證,在物體移動精度、空間場景一致性等核心指標上已達到國際領先水平。其創新性的空間建模能力,有效解決了傳統開源模型在三維空間理解方面的技術瓶頸。
模型具備三大核心空間編輯能力:在視角變換方面,用戶可通過自然語言指令調整相機偏航角、俯仰角及縮放參數,模型能自動生成符合幾何邏輯的新視角圖像;空間漫游功能支持連續視角移動,可生成邏輯連貫的多視角圖像序列;物體空間關系操控技術則能在保持場景整體結構穩定的前提下,對特定物體進行位移、縮放等變換,同時自動優化遮擋關系與光影效果。
除空間編輯能力外,該模型還兼容15類通用圖像編輯功能,涵蓋物體替換、刪除、添加等基礎操作,以及風格遷移、細節精修等高級需求。這種"空間+平面"的雙重編輯能力,使其能夠滿足從電商內容生產到創意設計制作等多樣化場景的應用需求。
在智能圖像處理領域,該模型可顯著提升復雜空間場景的編輯效率與質量;在3D模型重建方面,其多視角生成能力為三維建模提供重要技術支持;在具身智能視覺感知領域,模型的空間理解能力為機器人環境感知、路徑規劃等研發提供了關鍵技術支撐。目前,相關技術文檔與開發工具包已同步開放,開發者可快速集成至各類應用場景。
















