滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

北大團隊突破擴散模型后訓練瓶頸，遞歸似然比優(yōu)化器實現(xiàn)效率性能雙提升

時間：2026-03-10 10:43:54 來源：互聯(lián)網編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在人工智能視覺生成領域，擴散模型憑借其卓越的高保真數(shù)據生成能力，已成為圖像合成、視頻生成等跨模態(tài)任務的核心技術框架。然而，如何讓預訓練后的擴散模型高效適配具體應用場景，始終是制約技術落地的關鍵難題。近期，一項發(fā)表于國際頂級學術會議的研究提出創(chuàng)新解決方案，通過設計遞歸似然比優(yōu)化器，為擴散模型后訓練開辟了兼顧效率與性能的新路徑。

當前擴散模型的后訓練方法主要依賴強化學習與截斷反向傳播兩類技術路線，但均存在顯著缺陷。截斷反向傳播通過終止部分梯度計算降低內存消耗，卻導致梯度估計出現(xiàn)結構性偏差，嚴重時模型會崩潰并生成純噪聲；強化學習雖能控制內存需求，但梯度估計方差過高，樣本效率低下且訓練收斂緩慢。實驗數(shù)據顯示，使用完整反向傳播訓練Stable Diffusion 1.4模型僅需50個時間步就消耗約1TB GPU內存，而現(xiàn)有優(yōu)化方法難以在訓練穩(wěn)定性與生成質量間取得平衡。

研究團隊提出的遞歸似然比優(yōu)化器，通過重構擴散鏈計算圖實現(xiàn)無偏且低方差的梯度估計。該技術包含三大核心模塊：一階估計模塊在初始時間步直接反向傳播獎勵模型，充分利用結構信息避免精度損失；半階優(yōu)化模塊引入長度可變的局部子鏈，通過隨機選擇起始位置捕捉多尺度視覺特征；零階估計模塊對剩余時間步采用參數(shù)擾動策略，確保無偏性同時降低計算開銷。這種半階梯度估計范式巧妙平衡了計算成本與優(yōu)化效果。

局部子鏈長度h作為關鍵調控參數(shù)，直接影響內存消耗與梯度方差的關系。研究團隊將h的取值問題轉化為帶內存約束的方差最小化優(yōu)化，推導出理論最優(yōu)解析解。實驗表明，在30-40GB主流GPU內存環(huán)境下，h=2時既能捕捉擴散鏈關鍵尺度信息，又可將整體方差降至飽和區(qū)間。當h增至3或4時，單步訓練時間呈指數(shù)級增長，但獎勵分數(shù)提升幅度不足5%，驗證了該參數(shù)選擇的工程合理性。

理論分析證實，遞歸似然比估計器具有無偏性，并給出了方差邊界與收斂速率保證。相較于傳統(tǒng)方法，該技術既解決了截斷反向傳播的偏差問題，又克服了強化學習的高方差缺陷，在計算效率與優(yōu)化性能間實現(xiàn)最優(yōu)平衡。實驗數(shù)據顯示，在文本到圖像生成任務中，基于Stable Diffusion 1.4的實驗使ImageReward分數(shù)從32.90提升至76.55，較主流方法提升幅度達14%-47%。

在文本到視頻生成任務的VBench基準測試中，該技術展現(xiàn)出顯著優(yōu)勢。在主體一致性、運動流暢度等6項核心指標上，加權平均分達84.63，超越VideoCrafter、Pika等開源及商業(yè)模型。特別在動態(tài)程度指標上取得70.69分，較次優(yōu)方案提升5.6%。研究團隊還開發(fā)了擴散思維鏈提示詞技術，通過分解原始提示詞為多尺度指令，使半階子鏈能精準定位生成缺陷的尺度特征，在手部生成等細粒度任務中實現(xiàn)突破性進展。

更多>同類資訊

從訓練到推理：高效擴散語言模型如何跨越效率瓶頸實現(xiàn)突破？

03-10

黑芝麻智能獲無極資本注資，智駕與機器人芯片雙引擎驅動放量在即

03-10

北京人形機器人創(chuàng)新中心：從“手搓”到智能生產，跨越產業(yè)“鴻溝”

03-10

AMD銳龍AI嵌入式P100處理器產品線再升級新增八核十核十二核版本

03-10

OpenAI擬收購Promptfoo，助力AI系統(tǒng)安全防護能力再升級

03-10

4萬億電網投資背后：智能數(shù)字化成新引擎，AI時代電網或成關鍵勝負手

03-10

高通旗下Arduino推出VENTUNO Q單板機助力邊緣AI與機器人應用創(chuàng)新發(fā)展

03-10

《Deponia》Steam限時免費領！手繪畫面搭配荒誕謎題，開啟冒險解謎之旅

03-10

SK海力士1c LPDDR6內存問世：數(shù)據處理提速33% 功耗直降超兩成

03-10

5分鐘閃充+1200公里續(xù)航！2026款仰望U8內飾煥新，硬派SUV再進化

03-10

魏牌V9X驚艷登場：東方美學加持，豪華配置打造6座插混大型SUV新標桿

03-10

復旦教授張軍平提醒：洗澡時別做人臉認證攝像頭視野遠超想象

03-10

揚州發(fā)力人工智能賦能制造業(yè)，2028年力爭300家企業(yè)完成網絡升級超30場景落地

到2028年，我市力爭推動300家制造業(yè)企業(yè)完成新型工業(yè)網絡升級改造，推廣30個以上高水平人工智能應用場景，推動全市規(guī)模以上工業(yè)企業(yè)開展人工智能應用水平診斷，人工智能在制造業(yè)重點產業(yè)鏈、關鍵環(huán)節(jié)和典型場景實現(xiàn)…

03-10

全國人大代表周迪：借檔案之力破局推動人工智能大模型語料升級

加強算法安全管理，對應用于檔案行業(yè)的AI算法進行安全評估和備案，杜絕算法被惡意攻擊導致數(shù)據泄露或檔案篡改。防止算法偏見，在訓練數(shù)據的選擇上，保證檔案樣本的多樣性，避免因歷史數(shù)據的不平衡導致AI在檔案鑒定或開放…

03-10

無錫推進“AI+制造”：兩年內為工業(yè)企業(yè)提供免費線上線下AI診斷服務

為推動人工智能與制造業(yè)深度融合，2026-2027年，市工業(yè)和信息化局將用兩年時間，按線上診斷常態(tài)化、線下診斷重點化、線上線下相結合原則，組織各級工信部門和人工智能服務商，向全市工業(yè)企業(yè)提供線上與線下相結合…

03-10

點擊查看更多 +

全站最新

韓國KOSPI指數(shù)暴漲6%

B站盈利與用戶增長背后：創(chuàng)作者與用戶深度關系構筑獨特生態(tài)位

抖音小游戲2026：生態(tài)賦能規(guī)模躍升，技術驅動行業(yè)邁向精品化新階段

增程技術輿論風向大變：從被批到受認可，理想揭秘背后緣由

吉利星越L全新長風系列上市！12.47萬元起享智能豪華燃油SUV新體驗

大眾安徽與眾08內飾官圖亮相！雙聯(lián)屏+豪華配置，3月上市引期待

熱門內容

本欄最新

5分鐘閃充+1200公里續(xù)航！2026款仰望U8內飾煥新，硬派SUV再進化

魏牌V9X驚艷登場：東方美學加持，豪華配置打造6座插混大型SUV新標桿

5分鐘閃充+第二代刀片電池！2026款仰望U8內飾煥新，重新定義百萬級硬派SUV

魏建軍親力代言魏牌V9X，攜多動力版本強勢入局“9系旗艦大戰(zhàn)”

華芯程獲超3億A+輪融資，浦東創(chuàng)投助力制造類EDA加速突圍

一汽奔騰2026年將推4款新車悅意03改款上市續(xù)航最長565公里

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

北大團隊突破擴散模型后訓練瓶頸，遞歸似然比優(yōu)化器實現(xiàn)效率性能雙提升