滾動資訊

當前位置：首頁 > 資訊 > 手機快報 > 正文內容

突破多任務瓶頸：UCL與華為攜手打造AI推理的“全能教練”新方案

時間：2026-02-07 22:17:10 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

倫敦大學學院、華為諾亞方舟實驗室與巴塞爾大學等機構組成的聯合研究團隊，在多任務語言模型訓練領域取得重要進展。其提出的MT-GRPO訓練框架通過動態平衡不同任務的學習強度，有效解決了傳統方法中"強者恒強、弱者恒弱"的失衡問題。這項發表于arXiv平臺的研究（編號：arXiv:2602.05547v1），為構建更可靠的通用型AI系統提供了新思路。

當前主流訓練方法存在顯著缺陷：一方面對簡單任務和復雜任務采用"一刀切"的資源分配策略，如同給食量不同的孩子分配相同份量的食物；另一方面存在大量無效訓練樣本，導致模型看似忙碌實則進步緩慢。研究團隊形象地將這種現象比作"課堂上的走神學生"——即便獲得訓練機會，也可能因梯度消失問題無法產生實際學習效果。

新框架的核心創新在于雙管齊下的改進機制。其"改進感知權重調整"系統突破了傳統僅關注任務絕對表現的局限，通過追蹤每個任務的進步軌跡動態調整訓練重點。當檢測到某個任務雖當前得分較低但進步顯著時，系統會保持現有訓練強度；若發現任務長期停滯不前，則會立即加大資源投入。這種機制確保模型發展既關注當前水平，更重視成長潛力。

配套開發的"比例保持采樣器"則解決了訓練效率難題。該組件通過預估每個任務的有效學習率，自動過濾無效訓練樣本。實驗數據顯示，在傳統方法中，若某任務分配30%訓練時間但僅30%樣本有效，實際學習時間僅9%；而新采樣器可將有效學習時間提升至接近理論值，確保資源投入產生實質性回報。

在數字推理、邏輯謎題和抽象模式識別三類典型任務的測試中，新方法展現出顯著優勢。三任務場景下，最弱任務的準確率較標準方法提升16-28個百分點，較先進方法DAPO提升6個百分點，同時訓練步數減少50%。當任務擴展至九個不同難度級別時，通過調節系統參數λ，可在提升最弱任務表現與維持整體性能間實現靈活平衡。

技術實現層面，研究團隊將多任務訓練轉化為約束優化問題，通過數學推導轉化為最大最小優化模型。系統采用softmax函數確保任務權重符合概率分布，配合梯度下降算法實現權重動態更新。這種設計既保證了理論嚴謹性，又確保了工程實現的穩定性。

消融實驗證實，改進感知權重調整和比例保持采樣器構成系統成功的兩大支柱。單獨移除任一組件都會導致性能顯著下降，驗證了理論分析的正確性。研究團隊特別指出，當前實驗基于30億參數模型，更大規模模型的適配性有待進一步驗證。

這項突破對AI應用產生深遠影響。在消費端，未來的AI助手將擺脫"偏科"局限，能夠在數學計算、邏輯推理、模式識別等多領域提供均衡可靠的服務。產業界則獲得重要技術工具，通過提升模型全面性增強市場競爭力，加速用戶信任建立和應用場景拓展。

研究團隊將訓練過程類比為教練培養運動員：新方法不僅關注運動員的當前成績，更重視其成長軌跡和潛力挖掘。這種訓練哲學推動AI發展從追求單項指標突破轉向追求整體能力均衡，為構建真正智能的系統開辟新路徑。技術細節詳見arXiv平臺完整論文。

更多>同類資訊

7英寸巨屏手機或迎回歸潮，兩大品牌布局，能否打破同質化困局？

02-07

華為Pura X激活量破百萬！Pura X2將至，今年闊折疊新機競爭激烈

如上圖所見，爆料達人數碼閑聊站稱華為Pura X累積激活銷量已超百萬，Pura X2也在路上了，大概率會用最新麒麟9030芯片，延續前代的闊折疊思路，升級形態比例和尺寸。加上華為和蘋果，今年預計有3家推闊折…

02-07

西圣PB-S移動電源實測：輕便雙線快充，百元價位安全省心之選

我實際用的時候也能感覺到，不管是快充還是同時給多臺設備充電，它的機身都只是微微溫熱，用測溫槍測了下，最高也就38℃，完全不燙手。它的優點很突出：179g輕便易攜，出門不占地；自帶蘋果+安卓雙線，不用額外帶…

02-07

鈷紫色亮眼登場！三星Galaxy S26 Ultra設計細節與發布時間全揭秘

IT之家 2 月 7 日消息，消息源 @Evleaks 昨日（2 月 6 日）在 X 平臺發布推文，分享了一段短視頻，360度旋轉展示了鈷紫色（Cobalt Violet）三星 Galaxy S26 Ult…

02-07

問界M9出海直面德系豪車：以智能電動豪華挑戰寶馬X7、奔馳GLS

02-07

春節返鄉高速行，十大安全準則助您平安抵達溫暖家

02-07

斯莫格推出耐寒版F970電池，-40°C環境可正常放電

02-07

鈷紫色首秀：三星Galaxy S26 Ultra手機渲染圖再曝

02-07

華為Pura X銷量破百萬成行業唯一二代闊折疊新機或攜麒麟9030芯片亮相

02-07

斯莫格耐寒版NP-F970電池來襲，-40°C穩定放電還能當移動電源

02-07

鈷紫色引領潮流：三星Galaxy S26 Ultra手機設計細節與發布時間全揭秘

02-07

鈷紫色引領潮流：三星Galaxy S26 Ultra渲染圖曝光，發布發售時間確定

02-07

華為鴻蒙HarmonyOS 6開發者版Beta招募啟動，5萬名額邀您嘗鮮新特性

02-07

萬興喵影桌面端煥新升級：基礎功能普惠開放，AI增值助力創作者釋放無限潛能

02-07

云端共享奧運技術，AI助力普通人將創意變為觸手可及的奇跡

他說這感覺就像突然獲得了一把萬能鑰匙，打開了曾經緊鎖的專業特效大門。杭州有個中學的編程興趣小組，孩子們用這些公開的代碼，試著在電腦上復原冬奧會那片片雪花飛舞的場景。技術不再是高高在上的東西。他寫道，希望這些…

02-07

點擊查看更多 +

全站最新

東風奕派事故引熱議，汽車門把手安全受關注！新國標明年起強制實施

2026年手機變局中，vivo以平常心深耕，用進取心破局

王騰創業滿月：組建大廠精英團隊獲千萬融資聚焦睡眠健康科技

雷軍豪言4年擴英門店至150家，SU7起火風波后，他還有安全新牌可打

千匹猛獸登場！小米YU7 GT亮相，欲在紐北挑戰德系高性能SUV霸主地位

雷軍駕駛小米SU7秀漂移神技畫面張力十足：安全第一切勿盲目跟風

熱門內容

本欄最新

問界M9出海直面德系豪車：以智能電動豪華挑戰寶馬X7、奔馳GLS

春節返鄉高速行，十大安全準則助您平安抵達溫暖家

阿維塔06T旅行版來襲，純電增程雙動力，能否成新能源市場新寵？

尊界S800春晚驚艷登場，華為智造賦能，開啟中國豪華汽車新篇章

第八代雷克薩斯ES煥新登場，車長超5米，油電混動與純電動力齊發力

四缸AMG C63停產落幕，大排量六缸上陣，性能車未來何去何從？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

突破多任務瓶頸：UCL與華為攜手打造AI推理的“全能教練”新方案