滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

港科大廣州校區(qū)創(chuàng)新優(yōu)化器Mano：為大模型訓(xùn)練開啟高效新路徑

時(shí)間：2026-02-05 00:35:35 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

在大型語言模型訓(xùn)練領(lǐng)域，一項(xiàng)突破性研究為提升效率、降低成本帶來了全新解決方案。香港某高校科研團(tuán)隊(duì)提出名為Mano的優(yōu)化器，通過創(chuàng)新設(shè)計(jì)顯著優(yōu)化了大模型訓(xùn)練過程，在性能提升與資源消耗控制方面取得雙重突破。

傳統(tǒng)訓(xùn)練方法面臨兩大核心矛盾：既要處理參數(shù)間的復(fù)雜關(guān)聯(lián)，又需控制計(jì)算資源消耗。當(dāng)前主流的AdamW優(yōu)化器如同逐題批改的教師，雖能處理單個(gè)參數(shù)卻忽視整體結(jié)構(gòu)；而Muon優(yōu)化器雖嘗試統(tǒng)一處理所有維度，卻因丟失曲率信息導(dǎo)致優(yōu)化效果受限。研究團(tuán)隊(duì)通過重構(gòu)優(yōu)化邏輯，創(chuàng)造性地將訓(xùn)練過程轉(zhuǎn)化為動(dòng)態(tài)幾何探索，使模型參數(shù)在平滑數(shù)學(xué)表面自主尋找最優(yōu)路徑。

Mano的核心機(jī)制在于"旋轉(zhuǎn)斜流形"設(shè)計(jì)，通過交替進(jìn)行列向與行向歸一化操作，實(shí)現(xiàn)多維參數(shù)空間的立體化探索。具體而言，該優(yōu)化器在奇數(shù)訓(xùn)練輪次執(zhí)行列方向歸一化，偶數(shù)輪次切換至行方向，這種動(dòng)態(tài)調(diào)整策略使模型能夠從不同角度解析參數(shù)關(guān)系。實(shí)驗(yàn)數(shù)據(jù)顯示，在LLaMA-350M模型訓(xùn)練中，Mano的收斂速度較Muon提升1.75倍，在1.3B參數(shù)規(guī)模下仍保持1.38倍的優(yōu)勢(shì)，且隨著模型規(guī)模擴(kuò)大，性能差距進(jìn)一步拉大。

資源消耗控制方面，Mano展現(xiàn)出顯著工程優(yōu)勢(shì)。其內(nèi)存占用與SGD動(dòng)量法相當(dāng)，僅為AdamW的50%，在70B參數(shù)規(guī)模的LLaMA模型訓(xùn)練中，注意力層歸一化耗時(shí)僅2.19毫秒，較Muon的110.79毫秒降低超98%。這種效率提升源于其避免復(fù)雜矩陣運(yùn)算的設(shè)計(jì)，每次參數(shù)更新僅需11mn次浮點(diǎn)運(yùn)算（m、n為矩陣維度），而Muon的Newton-Schulz迭代計(jì)算量呈指數(shù)級(jí)增長(zhǎng)。

理論層面，研究團(tuán)隊(duì)證明Mano的交替歸一化過程等價(jià)于Sinkhorn-Knopp迭代算法，可確保矩陣收斂至雙隨機(jī)矩陣，從而保證優(yōu)化穩(wěn)定性。頻譜分析顯示，該優(yōu)化器在提升稀有方向更新幅度的同時(shí)，完整保留奇異值原始排序，這種結(jié)構(gòu)化處理方式有效避免了Muon因白化操作導(dǎo)致的信息丟失。梯度穩(wěn)定性測(cè)試進(jìn)一步證實(shí)，Mano在相同動(dòng)量系數(shù)下，梯度方差降低40%，信噪比提升25%，為持續(xù)優(yōu)化提供可靠保障。

實(shí)際應(yīng)用中，Mano展現(xiàn)出極強(qiáng)的適應(yīng)性。其實(shí)現(xiàn)僅需設(shè)置學(xué)習(xí)率、動(dòng)量系數(shù)和權(quán)重衰減三個(gè)參數(shù)，超參數(shù)調(diào)優(yōu)復(fù)雜度低于AdamW。對(duì)于一維偏置參數(shù)，團(tuán)隊(duì)建議沿用AdamW優(yōu)化，形成混合優(yōu)化策略。研究團(tuán)隊(duì)還開發(fā)了高維張量版本，通過循環(huán)遍歷各維度實(shí)現(xiàn)通用化處理，支持Transformer等復(fù)雜架構(gòu)的參數(shù)優(yōu)化。

與現(xiàn)有方法的對(duì)比實(shí)驗(yàn)揭示了Mano的獨(dú)特價(jià)值：在訓(xùn)練初期，AdamW憑借自適應(yīng)學(xué)習(xí)率實(shí)現(xiàn)快速收斂；中期Muon通過頻譜歸一化展現(xiàn)優(yōu)勢(shì)；而Mano在后期持續(xù)保持穩(wěn)定下降趨勢(shì)，最終模型性能超越兩個(gè)基準(zhǔn)優(yōu)化器。這種訓(xùn)練階段特異性優(yōu)勢(shì)，使其特別適用于需要深度優(yōu)化的超大規(guī)模模型訓(xùn)練場(chǎng)景。

該研究重新激活了流形優(yōu)化在深度學(xué)習(xí)領(lǐng)域的應(yīng)用潛力。通過將經(jīng)典數(shù)學(xué)理論與現(xiàn)代工程實(shí)踐結(jié)合，團(tuán)隊(duì)證明適當(dāng)改造的傳統(tǒng)方法仍能解決前沿技術(shù)難題。這種研究范式為優(yōu)化器設(shè)計(jì)提供了新思路：在追求算法創(chuàng)新的同時(shí)，深度挖掘現(xiàn)有理論的改造空間，往往能產(chǎn)生兼具理論美感與實(shí)用價(jià)值的解決方案。

02-05

特拉維夫大學(xué)新突破：AI訓(xùn)練“精準(zhǔn)瘦身”，高效學(xué)習(xí)關(guān)鍵知識(shí)

02-05

浮點(diǎn)實(shí)驗(yàn)室SLIME新招：破解大模型“學(xué)新忘舊”的成長(zhǎng)困境

02-05

工業(yè)機(jī)器人龍頭埃斯頓：憑深厚積累，強(qiáng)勢(shì)入局人形機(jī)器人賽道

02-05

存儲(chǔ)龍頭江波龍：兩年逆襲，借AI東風(fēng)創(chuàng)盈利新高，未來可期

02-05

大成基金：以深度產(chǎn)業(yè)研究為帆駛向長(zhǎng)期穩(wěn)健回報(bào)的夏普彼岸

02-04

從“物理拼接”到“化學(xué)融合”：“人工智能+制造”的變革新路徑

02-04

從招聘動(dòng)向看OpenAI2026布局：企業(yè)級(jí)市場(chǎng)成其關(guān)鍵發(fā)力點(diǎn)

02-04

2026新疆新能源展：光伏領(lǐng)航，共探綠色能源新未來新機(jī)遇

02-04

四川新能源“領(lǐng)跑者”：華劍鋒攜創(chuàng)新建議，解鎖產(chǎn)業(yè)升級(jí)新密碼

02-04

豐田加碼混動(dòng)賽道：2028年產(chǎn)量劍指670萬，多家車企布局混動(dòng)市場(chǎng)

02-04

面壁智能MiniCPM-o 4.5開源：全模態(tài)交互革新，多領(lǐng)域性能提升引領(lǐng)AI新潮

02-04

瑞莎Cubie A7S AI開發(fā)板上市：199元起，低功耗適配本地化AI應(yīng)用

02-04

OpenAI引入Anthropic前安全專家 Dylan Scand 領(lǐng)銜應(yīng)對(duì)AI模型高風(fēng)險(xiǎn)

02-04

英偉達(dá)CEO確認(rèn)將參與OpenAI新融資或考慮其IPO投資

02-04

點(diǎn)擊查看更多 +

全站最新

公告精選︱長(zhǎng)安汽車：計(jì)劃回購10億元-20億元公司股份；晶科能源：未有涉及“太空光伏”的訂單收入

券商2月“金股”名單來了！堅(jiān)守“科技+周期”雙主線

納斯達(dá)克中國(guó)金龍指數(shù)跌1%

豪威集團(tuán)(00501.HK)獲摩根大通增持27.71萬股

2月5日A股投資避雷針︱光大嘉寶：股東嘉定建業(yè)與嘉定科投擬合計(jì)減持不超1%股份；青達(dá)環(huán)保：股東冰輪環(huán)境擬減持不超3%股份

群星璀璨，追覓之夜：當(dāng)音樂與科技交織，創(chuàng)新與關(guān)懷并行

熱門內(nèi)容

本欄最新

豐田加碼混動(dòng)賽道：2028年產(chǎn)量劍指670萬，多家車企布局混動(dòng)市場(chǎng)

卡奧斯赴港IPO：借AI與物聯(lián)網(wǎng)雙翼引領(lǐng)工業(yè)數(shù)智化轉(zhuǎn)型新征程

西部數(shù)據(jù)煥新啟航：正式更名WD，聚焦AI與云計(jì)算開啟增長(zhǎng)新篇章

技術(shù)前瞻布局+爆款車型助力元戎啟行智駕賽道市占率攀升新高度

純電車型智能新篇：智能互聯(lián)與語音交互引領(lǐng)未來出行新潮流

華為哈勃等入股北京跨赴科技助力AI軟件領(lǐng)域再添新力量

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

港科大廣州校區(qū)創(chuàng)新優(yōu)化器Mano：為大模型訓(xùn)練開啟高效新路徑