阿里巴巴近日正式推出圖像生成與編輯領域的統(tǒng)一模型Wan2.7-Image,針對當前AI生圖領域存在的審美同質化、色彩控制困難等核心問題,提供了一套創(chuàng)新解決方案。該模型通過深度優(yōu)化虛擬形象生成與色彩管理技術,實現(xiàn)了從面部特征到整體風格的個性化定制,同時支持高精度色彩參數(shù)調控,為創(chuàng)作者提供更自由的表達空間。
在虛擬形象生成方面,Wan2.7-Image突破了傳統(tǒng)AI生成"標準臉"的局限。通過強化骨相結構分析與五官細節(jié)雕刻能力,用戶可基于提示詞自由調整臉型輪廓、眼部特征等數(shù)十項參數(shù),實現(xiàn)從鵝蛋臉到方臉、從杏仁眼到丹鳳眼的精準控制。這種從骨骼結構到表皮特征的分層建模技術,使生成的虛擬形象更具真實感和辨識度,有效解決了行業(yè)長期存在的"AI臉"同質化問題。
色彩管理系統(tǒng)的革新是該模型的另一大亮點。全新開發(fā)的"調色盤"功能支持通過Hex代碼提取參考圖色彩參數(shù),用戶可自由調整色相分布比例,構建個性化配色方案。這項技術突破使得色彩應用從隨機生成轉變?yōu)榭煽貏?chuàng)作,特別適用于需要嚴格色彩管理的商業(yè)設計場景,如品牌視覺系統(tǒng)開發(fā)、產品包裝設計等。
針對專業(yè)領域的特殊需求,Wan2.7-Image在文字渲染能力上實現(xiàn)質的飛躍。通過優(yōu)化長文本處理架構,模型可支持最高3K tokens的輸入量,能夠清晰呈現(xiàn)學術論文、法律文件等復雜文本內容,文字清晰度達到印刷級標準。該功能已實現(xiàn)12種語言覆蓋,包括中英文混合排版等復雜場景,為學術研究、商務報告等場景提供高效解決方案。
在多圖像協(xié)同創(chuàng)作方面,模型展現(xiàn)出強大的場景構建能力。通過支持最多9張參考圖的多主體一致性生成技術,可保持不同視角下的人物特征、建筑風格等核心元素統(tǒng)一。這項技術特別適用于電影海報制作、電商套圖生成等需要風格連貫性的創(chuàng)作場景,顯著提升批量生產效率的同時保證作品質量。
技術架構層面,Wan2.7-Image采用生成與理解統(tǒng)一的創(chuàng)新模型架構。通過整合超大規(guī)模異構數(shù)據(jù)集,涵蓋從日常物品到專業(yè)領域的全品類視覺素材,并引入理解類數(shù)據(jù)增強語義關聯(lián)能力。配合多維精細標注體系,模型能夠準確解析提示詞中的空間關系、光影效果等復雜指令,大幅降低創(chuàng)作試錯成本。
同步上線的Wan2.7-Image-Pro版本進一步強化專業(yè)性能。基于更大規(guī)模數(shù)據(jù)訓練的增強版模型,在構圖穩(wěn)定性、語義理解精度等關鍵指標上實現(xiàn)提升,特別適合需要高精度輸出的商業(yè)設計、建筑可視化等專業(yè)場景。兩個版本形成互補,滿足不同層次用戶的創(chuàng)作需求。
實際應用場景中,該模型已展現(xiàn)出跨行業(yè)賦能潛力。影視制作團隊可利用其低成本完成角色概念設計、動作預演等前期工作;電商從業(yè)者能夠快速生成多場景商品圖,降低傳統(tǒng)拍攝成本;教育科研領域則可直接調用模型生成論文插圖、信息圖表等教學素材。特別開發(fā)的技能調用功能,甚至支持讓虛擬形象完成特定任務創(chuàng)作,進一步拓展AI藝術的應用邊界。









