滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

螞蟻集團與清華聯手：AReaL框架突破AI推理訓練瓶頸，效率飆升2.77倍

時間：2026-03-04 14:38:39 來源：ITBEAR編輯：快訊 IP：北京 發表評論無障礙通道

螞蟻集團與清華大學聯合宣布，正式推出開源強化學習訓練框架AReaL v1.0穩定版。這一系統專為大規模異步強化學習設計，通過徹底解耦數據生成與模型訓練流程，顯著提升了大語言模型在推理任務中的訓練效率，尤其適用于需要處理海量思考Token的復雜場景。

傳統強化學習訓練系統普遍采用同步機制，要求生成階段必須等待批次中最慢的輸出完成才能啟動訓練。這種"木桶效應"導致大量GPU資源長期閑置，在處理需要生成數萬個思考Token的數學推理或代碼生成任務時，效率瓶頸尤為突出。研究團隊指出，同步系統的硬件利用率不足問題已成為制約大模型訓練規模擴展的關鍵因素。

AReaL系統采用完全異步架構，通過流水線式并行設計打破傳統限制。生成工作器可持續不斷產生新數據，訓練工作器則在數據積累到閾值后立即啟動模型更新，兩個環節完全獨立運行。這種設計消除了同步等待時間，使硬件資源利用率提升數倍，訓練過程呈現連續流暢特征。實驗數據顯示，在相同GPU配置下，系統處理復雜推理任務的速度較主流同步方案提升最高達2.77倍。

針對異步訓練帶來的數據"陳舊度"挑戰，研發團隊創新性地提出陳舊度感知訓練機制。該機制通過動態調整工作負載分配，在保證訓練穩定性的同時最大化數據新鮮度。系統還引入解耦PPO目標函數與可中斷生成技術，允許模型在生成過程中實時接收權重更新，徹底消除傳統方案中"生成-訓練"的割裂狀態。

性能驗證顯示，AReaL在數學推理（GSM8K、MATH）和代碼生成（Humaneval）等基準測試中表現優異。除訓練速度顯著提升外，模型在部分任務中的解題準確率反而出現增長。研究團隊認為，異步架構帶來的持續數據流動和模型更新，可能有助于大語言模型保持更優的推理狀態。該框架現已開源，開發者可通過指定渠道獲取完整代碼與文檔。

更多>同類資訊

康奈爾大學新突破：首次直接觀測芯片原子級“鼠咬”缺陷助力研發

03-04

《CS:GO》重返Steam商店可免費下載僅支持離線對戰且游戲時長成就不繼承

03-04

MWC 2026：榮耀攜機器人手機與折疊屏亮相，探索AI物理世界新可能

類手持云臺這個形態來自大疆的 Pocket 手持云臺相機，但將整個結構放在手機上后，想象空間也多了很多—— 撇開腦洞大開的 RobotPhone 和迭代大折疊 Magic V6，榮耀在今年的 MWC 展臺…

03-04

開源項目助力AI“走出屏幕”：OpenClaw與機器人結合開啟具身智能新篇章

首先是一個代理抽象層：開發者可通過該層在目標、推理和自主性之間建立清晰接口，實現意圖與運動控制的交互；其次是一種與硬件無關的通用標準：允許軟件在不同人形機器人平臺運行；根據 Menlo Research …

03-04

MWC 2026：中興AI寵物iMoochi萌趣登場，努比亞多款新機齊亮相

這款“AI新物種”，并非第二代豆包手機，而是主打情感陪伴的AI寵物產品：iMoochi，只在拓展中興 AI 終端品類的布局。除了“第一代豆包手機”完成海外首秀，努比亞還在MWC 2026展會上帶來了另一款…

03-04

國產大模型崛起！MiniMax M2.5霸榜全球，M3.0蓄勢待發決戰DeepSeek V4

03-04

?毀滅性風險！研究發現 AI 在 95% 模擬核危機中傾向選擇“核打擊”

03-04

不僅是性價比之王！MiniMax 2.5 霸榜全球調用量：月收入破 1.5 億美元，M3 旗艦版上半年發布

03-04

MiniMax配得上2500億市值嗎？

03-04

階躍星辰全面開源Step 3.5 Flash：推理速度最高可達350TPS

03-04

蘋果新款MacBook Air攜M5芯片登場：存儲升級AI強化輕薄本再進化

03-04

MiniMax的2500億市值之問：技術拐點下的生死棋局與未來懸念

03-04

全國政協委員楊成長：以創新投研與制度優化助力“長錢”入市

03-04

AI熱潮驅動電子行業騰飛滬市22家電子企業2025年業績報喜增長顯著

03-04

MiniMax轉型AI平臺初顯成效智能與Token雙輪驅動甩出行業新考題

03-04

點擊查看更多 +

全站最新

750億美元的“電力豪賭”背后，哪些企業將受益？

臺股收跌4.35%，半導體股領跌

A股智能電網股強勢，銀星能源、神馬電力等多股漲停

看好珍酒李渡發展韌性，方正證券維持"推薦"評級

A股銀行股普跌

A股電力股逆勢上漲，豫能控股漲超6%

熱門內容

本欄最新

地平線HSD賦能iCAR V27，硬派SUV智駕革新，開啟出行新體驗

零跑A10小型SUV 3月26日開啟預售，雙芯加持續航最長505公里

MWC26華為釋放新信號：5G-A與AI融合，開啟十萬億級智能體互聯網新篇

中國電信攜手華為完成多芯光纖跨城智算互連現網驗證性能接近集中訓練

華為李鵬：智能體互聯時代來臨，5G-A與AI融合催生十萬億新產業機遇

華為李鵬MWC26演講：5G-A融合AI，未來十年網絡價值邁向智能體互聯新藍海

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

螞蟻集團與清華聯手：AReaL框架突破AI推理訓練瓶頸，效率飆升2.77倍