岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

阿里智能引擎團隊突破AI生圖速度極限:2步生成2K高清圖,5秒即現(xiàn)四張佳作

   時間:2026-01-30 22:25:44 來源:天脈網(wǎng)編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

在AI圖像生成領(lǐng)域,擴散模型因其出色的生成效果備受關(guān)注,但傳統(tǒng)模型生成速度慢的問題一直困擾著用戶。如今,阿里智能引擎團隊帶來了一項重大突破——僅需5秒,就能生成4張2K級高清大圖,將圖像生成效率提升到了全新高度。

針對Qwen最新開源模型,該團隊實現(xiàn)了SOTA壓縮水平的巨大飛躍,將原本需要80 - 100步前向計算才能完成的圖像生成,驟降至僅需2步,速度整整提升了40倍。以往像Qwen - Image生成一張圖片需要近一分鐘,現(xiàn)在眨眼間就能完成,大大節(jié)省了用戶的時間。

這一成果的背后,是團隊對傳統(tǒng)蒸餾方案的深入研究和創(chuàng)新改進(jìn)。早期的軌跡蒸餾方案,如Progressive Distillation和Consistency Distillation,主要思想是讓蒸餾后的學(xué)生模型(student model)模仿原模型(teacher model)在多步生成的路徑。但在實踐中,這類方法在低迭代步數(shù)下難以實現(xiàn)高質(zhì)量生成,生成的圖像模糊,尤其是對于一些細(xì)節(jié)部分,如文字、人物五官等,因占比低而學(xué)習(xí)不充分,導(dǎo)致學(xué)生模型的細(xì)節(jié)出現(xiàn)明顯扭曲。這是因為軌跡蒸餾直接對學(xué)生模型的生成樣本做約束,對所有圖像patch一視同仁,沒有突出細(xì)節(jié)部分的重要性。

為了解決這一問題,團隊將目光投向了基于概率空間的蒸餾方案。近期,這類方案在較少步數(shù)場景(4 - 8步)取得了巨大成功,其中DMD2算法最具影響力。DMD2將約束從樣本空間轉(zhuǎn)換到了概率空間,其Loss設(shè)計為典型的Reverse - KL蒸餾Loss。這種設(shè)計有一個顯著特性:當(dāng)學(xué)生模型生成的圖片不符合真實圖片分布時,Loss會爆炸。因此,DMD2算法的本質(zhì)是讓學(xué)生模型自己生成圖片,然后由教師模型指導(dǎo)哪里不對,而不是直接告訴學(xué)生模型應(yīng)該模仿什么。這種設(shè)計顯著提升了生成圖片的細(xì)節(jié)性和合理性,成為當(dāng)下擴散步數(shù)蒸餾的主要策略。

然而,Reverse - KL也存在一些問題,如mode - collapse和分布過于銳化,具體表現(xiàn)為多樣性降低、飽和度增加、形體增加等,在2步蒸餾的設(shè)定下這些問題尤為突出。為了緩解分布退化問題,團隊使用PCM蒸餾進(jìn)行模型熱啟動,給模型一個更合理的初始化。實驗表明,熱啟動后的模型的形體扭曲問題得到明顯改善。

雖然DMD2極大提升了方案的普適性,但它也有局限,即學(xué)生模型永遠(yuǎn)學(xué)習(xí)教師模型的生成分布,無法超越教師模型。同時,由于loss設(shè)計的問題,DMD2蒸餾在高質(zhì)量細(xì)節(jié)紋理(如苔蘚、動物毛發(fā)等)上生成的效果往往不盡如人意。為了增強2步學(xué)生模型在細(xì)節(jié)上的表現(xiàn)能力,團隊引入了對抗學(xué)習(xí)(GAN)來進(jìn)一步提升監(jiān)督效果。

GAN的Loss包括生成Loss和判別Loss,生成Loss是讓生成圖騙過判別器,判別Loss是區(qū)分真假圖。簡單來說,對抗訓(xùn)練一方面需要判別器盡可能判定學(xué)生模型生成的圖片為假,另一方面需要學(xué)生模型盡可能欺騙判別器。為了提升對抗訓(xùn)練的穩(wěn)定性和效果,團隊做了多項改進(jìn),如采用真實數(shù)據(jù)混合策略,按固定比例混合高質(zhì)量真實數(shù)據(jù)和教師生成圖,提升泛化度和訓(xùn)練穩(wěn)定性;引入額外的DINO模型作為特征提取器,提供更魯棒的特征表示;增加對抗訓(xùn)練在loss中的占比。經(jīng)實驗驗證,增加對抗訓(xùn)練后,學(xué)生模型的畫面質(zhì)感和細(xì)節(jié)表現(xiàn)發(fā)生顯著提升。

目前,團隊已將相應(yīng)的Checkpoint發(fā)布至HuggingFace和ModelScope平臺,開發(fā)者可下載體驗。同時,該模型已經(jīng)集成到嗚哩AI平臺上,支持調(diào)用。盡管在大多數(shù)場景下Wuli - Qwen - Image - Turbo能夠和原模型比肩,但在一些復(fù)雜場景下,受限于去噪步數(shù),仍存在可改進(jìn)空間。團隊表示,在后續(xù)的版本中將會持續(xù)發(fā)布速度更快、效果更好的生成模型,并迭代更多擴散加速技術(shù),開源模型權(quán)重。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 久久成人激情 | 天天曰天天操 | 瑟瑟综合网 | 久久爱伊人 | 午夜性福利视频 | 日日爽夜夜爽 | 91激情在线| 国产欧美一区二区三区在线老狼 | 成人高清在线视频 | 免费黄色在线 | www.黄色大片 | 成人一区二区三区视频 | 色婷婷在线播放 | 黄色网址国产 | 日韩第九页 | 国产精品久久久久久69 | 91亚洲国产成人精品一区二三 | 精品国产一区二区三区久久久蜜月 | 色狠狠综合 | 久草色视频 | 三级福利片| 伊人久久精品一区二区三区 | 国精品人伦一区二区三区蜜桃 | 亚洲最大av网 | 日韩一区二区三区在线视频 | 在线免费看黄色片 | 国产精品一 | 一级黄色片欧美 | 麻豆精品久久久 | 永久免费精品 | 欧美成人三级视频 | 26uuu精品一区二区 | 中文字幕av免费观看 | 欧美精品免费在线 | av一区在线播放 | 中文字幕avav| 九九午夜 | 欧美日韩精品区 | 久久久久久国产精品免费免费 | 国产在线黄色 | 免费一区二区三区 |