滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

香港大學團隊創新：代理壓縮法讓AI模型訓練高效與性能“雙豐收”

時間：2026-02-07 21:59:57 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

人工智能語言模型訓練領域迎來了一項革新性突破。香港大學與抖音聯合團隊提出了一種名為"代理壓縮"的新型訓練范式，通過同時利用壓縮數據與原始數據，在保持訓練效率的同時顯著提升了模型的適應能力。這項研究已在預印本平臺arXiv公開，編號為2602.04289v1，為AI系統設計開辟了全新路徑。

傳統語言模型訓練面臨兩難困境：使用簡化處理的壓縮文本雖能加速訓練，但會丟失關鍵信息；采用原始文本雖能保留完整語義，卻需要消耗大量計算資源。研究團隊通過創新設計，讓模型在訓練階段同時接觸兩種數據形態——90%時間處理壓縮數據，10%時間接觸原始字節數據。這種混合訓練方式使模型在部署階段僅需原始輸入，就能達到傳統壓縮訓練的效率水平。

實驗數據顯示，大型模型在該訓練框架下展現出驚人潛力。當模型參數規模達到140億級時，其處理原始數據的性能已能與傳統分詞模型媲美，甚至在部分編程任務中實現超越。這種跨格式理解能力源于模型在訓練過程中建立的"雙語翻譯"機制，就像人類同時掌握兩種語言體系，能在不同表達方式間自由切換。

研究團隊通過對比實驗發現，并非所有壓縮方法都適合作為"代理"。傳統分詞和神經網絡壓縮因能保持語義穩定性而表現優異，而基于gzip的通用壓縮算法則因輸出波動過大被淘汰。這種特性差異直接影響模型訓練效果，為后續技術選型提供了重要參考。

在編程任務測試中，代理壓縮模型展現出獨特優勢。面對代碼格式變化、空格調整等干擾因素，其性能穩定性顯著優于傳統分詞模型。更令人驚訝的是，當同時提供壓縮與原始版本內容時，模型能實現95%以上的精準對應轉換，這種"即時翻譯"能力為多模態處理提供了新思路。

技術實現層面，研究團隊開發了基于信息熵的并行處理策略，使神經壓縮方法的處理速度提升百倍以上。對于傳統分詞方法，他們發現直接使用分詞索引作為輸入比復雜編碼更有效。訓練過程中通過特殊標記區分數據類型，幫助模型清晰識別不同輸入形態。

大規模驗證實驗采用TB級代碼語料庫進行訓練，結果顯示代理壓縮模型在保持跨格式轉換能力的同時，實際編程性能已接近專業領域頂尖模型。這種在效率與能力間取得平衡的特性，解決了長期困擾研究界的計算資源分配難題。

該成果的影響遠超技術層面。研究證明AI系統不必受限于單一數據表示方式，訓練階段可采用混合格式提升模型泛化能力，部署階段回歸原始輸入確保通用性。這種設計理念可能重塑未來AI架構的發展方向，為構建更智能、更魯棒的系統提供新范式。

盡管當前驗證主要集中于代碼生成領域，但研究團隊指出該方法具有普適性潛力。對于資源受限的小型模型，他們正在探索優化訓練策略，試圖在保持效率的同時提升跨格式理解能力。這項探索為不同規模AI模型的訓練提供了全新參考框架。

針對讀者關心的核心問題，研究團隊給出明確解答：代理壓縮訓練通過建立數據形態間的對應關系，使模型既能享受壓縮訓練的高效，又能保持原始輸入的處理能力；相比傳統分詞，該方法避免了語言偏見、攻擊漏洞等問題，在格式變化時表現更穩定；其效果與模型規模正相關，大型模型能更好發揮跨格式學習優勢。

更多>同類資訊

千問3.5開源引全球熱潮，國際國產廠商齊適配，多平臺迅速上線

02-18

YouTube推薦系統突發故障致超35萬用戶受影響現已全面修復恢復正常服務

02-18

春晚機器人成“頂流”！多款被秒搶一空，62萬元高端款也瞬間售罄

如果我們能因為我們的一個作品，帶動了一個產業的勃興，帶動了一個領域的這種破圈的關注度，這個我覺得是每一個創作者的榮耀。” 據悉，從確定仿生人形機器人要登上春晚開始，僅經過兩個多月，松延動力就完成了從全棧自主研…

02-18

春晚“頂流”新歸宿！魔法原子“國寶熊貓機器人”57527元成交引關注

買家是一位來自北京的網友，在激烈競價中脫穎而出，將這件融合科技與萌寵元素的頂流“國寶熊貓機器人”收入囊中。在宜賓分會場，上百臺以“國寶熊貓”造型呈現的“MagicPanda”四足機器人上演了一場盛大表演，成…

02-18

春節零號灣“不打烊”：創業者于假期靜謐中，深挖技術、打磨產品謀新篇

鉅蛟光電創始人楊佳苗出現在辦公室，從教學、科研和管理的三重壓力中短暫抽身，他終于能定心坐下來，梳理新一年的學術方向與公司戰略。“國外走了幾十年，我們要填補他們在硬件上的優勢絕非一日之功，但可以用算法去補償硬件…

02-18

科沃斯T90與熱門掃地機器人大比拼：誰才是智能清潔的優選答案？

為了更好地了解T90的市場地位，我們將與以下幾款同類產品進行詳細對比：iRobotRoombai7、石頭科技S5Max、360掃地機器人和小米米家掃地機器人。總結來看，科沃斯T90憑借其智能導航、強勁清潔能力…

02-18

B站馬年春晚彈幕破億！“啊？”成熱門，“上B站看春晚”成新儀式

02-18

蘋果加速布局AI可穿戴領域：智能眼鏡、別針吊墜及攝像頭AirPods蓄勢待發

02-18

谷歌AI搜索功能升級，更突出展示信息來源鏈接

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發的竟是“啊”

02-18

豆包登頂蘋果App Store免費榜此前與春晚聯動互動總數達19億

02-18

消息稱蘋果正研發三款AI可穿戴設備：包括AI智能眼鏡等

02-18

馬斯克官宣 Grok 4.2 公開測試版上線，具備快速學習能力

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發的竟是“啊”

02-18

馬年春節人形機器人“搶灘”租賃市場，行業能否借春晚東風再起飛？

02-18

點擊查看更多 +

全站最新

日產奇駿海外煥新登場！澳洲市場燃油混動雙選，售價約18.6萬起

保時捷電動718或生變數奧迪高德諾確認“下一代TT”開發穩步推進

全合成機油分日系美系？別被誤導！選對關鍵看發動機要求

吉利銀河星耀6新版本亮相工信部，28.3千瓦時電池助力170公里純電續航

保時捷電動718存變數，奧迪“下一代TT”開發推進未來可期

奔馳全新概念車亮相，以現代設計重現1971年“紅豬”傳奇風采

熱門內容

本欄最新

春節不打烊：上海零號灣創業者借“窗口期”深耕技術，蓄勢待發迎新程

歲末冬日暖意濃廟壩鎮集體分紅繪就共富新篇章

馬斯克三度確認：特斯拉Cybercab 2026年4月投產初期產能或受限

全新奔馳GLA來襲：純電混動雙選擇，800V架構續航快充雙突破

假期租車出游全攻略：巧用規則租純電SUV，省錢又便利還超有趣

特斯拉Cybercab首輛量產車下線 2026年量產或成特斯拉產量最高車型

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

香港大學團隊創新：代理壓縮法讓AI模型訓練高效與性能“雙豐收”