岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

MIT攜手英偉達,推理大模型訓練效率最高提速210%

   時間:2026-02-28 12:55:36 來源:IT之家編輯:快訊 IP:北京 發表評論無障礙通道
 

2 月 28 日消息,MIT News 于 2 月 26 日發布博文,報道稱麻省理工學院(MIT)聯合英偉達等機構,發布“馴服長尾”(TLT)技術,可以大幅提升推理大語言模型(LLM)的訓練效率。

援引博文介紹,推理大模型擅長通過拆解步驟來解決復雜問題,但在強化學習(RL)的訓練過程中,算力與能耗的消耗極為巨大。

研究團隊發現,生成多個備選答案的“推演”(rollout)階段占據了高達 85% 的訓練時間。由于不同處理器生成回答的長度不一,完成較快的處理器只能被迫閑置,等待其他處理器完成長文本任務,從而形成了嚴重的效率瓶頸。

MIT 研究人員為解決該痛點,聯合英偉達、蘇黎世聯邦理工學院等機構,提出了一種名為“馴服長尾(TLT)”的自適應解決方案。

該方案的核心在于創新性地運用“投機解碼”技術,即訓練一個較小的“草稿模型”(drafter)來快速預測大模型的未來輸出,隨后由大模型批量驗證這些猜測。這樣一來,大模型無需逐個順序生成輸出,從而大幅加快了處理進程。

在傳統的投機解碼中,草稿模型通常只訓練一次并保持靜態。然而在強化學習中,主模型需要更新數千次,靜態草稿模型會迅速失效。

因此,TLT 系統引入了“自適應草稿訓練器”。一旦部分處理器完成短查詢進入閑置狀態,系統會立即調度它們實時訓練草稿模型。

同時,“自適應推演引擎”會根據工作負載特征自動調整解碼策略,確保草稿模型始終與目標大模型保持高度同步,且不增加額外算力開銷。

基于真實世界數據集的測試表明,TLT 技術在保持模型準確率完全無損的情況下,將多個推理大語言模型的訓練速度提升了 70% 到 210%。

不僅如此,訓練得到的輕量級草稿模型還可以作為免費的副產品,直接用于后期的高效部署。研究團隊未來計劃將該技術融入更多訓練與推理框架中,進一步降低 AI 開發成本并提升能源利用率。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 在线中文av| 国产亚洲欧美视频 | 中文视频在线 | 97爱爱| 极品毛片| 日韩成人在线观看视频 | 成人深夜网站 | 精品一区二区三区视频 | 高清久久久 | 中文字幕在线观看日韩 | 国产精品美女久久久久久久久 | 免费av网站在线看 | 黄色片成年人 | 热久久国产| 欧美日本中文字幕 | 有码中文字幕 | 男女做爰猛烈刺激 | 欧美大胆a | 久久天堂精品 | 欧美一区二区三区视频 | 在线观看日本中文字幕 | 一级做a爱片久久毛片 | 特级毛片在线播放 | 中国成人毛片 | 天堂a在线| 国产主播在线观看 | 日本久久不卡 | 国产视频在线观看一区二区 | 欧美视频不卡 | 粉嫩av一区二区三区天美传媒 | 欧美精品中文 | 久久一区二区视频 | 天天躁日日躁aaaaxxxx | 中文字幕日韩一区二区 | 色区视频| 亚洲波多野结衣 | 日本免费网 | 亚洲国产不卡 | 中国特黄一级片 | 午夜久久久久久久久久久 | 国产视频一 |