岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣：

滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

小米MiMo發(fā)布HySparse架構(gòu)：以混合稀疏設(shè)計(jì)破解Agent超長文本處理難題

時(shí)間：2026-02-07 17:27:21 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

在人工智能Agent模型迅猛發(fā)展的當(dāng)下，如何高效處理超長文本成為行業(yè)核心挑戰(zhàn)。這些模型不僅需要精準(zhǔn)檢索長上下文中的關(guān)鍵信息，還要在多輪推理中保持高速響應(yīng)，計(jì)算成本與效率的平衡成為技術(shù)突破的關(guān)鍵方向。針對(duì)這一痛點(diǎn)，小米MiMo團(tuán)隊(duì)近日推出HySparse混合稀疏注意力架構(gòu)，通過創(chuàng)新設(shè)計(jì)實(shí)現(xiàn)了性能與效率的雙重優(yōu)化。

該架構(gòu)采用"極少量全注意力層+多層稀疏注意力層"的組合模式，在800億參數(shù)規(guī)模的MoE模型實(shí)驗(yàn)中，僅保留5層全注意力層即可維持模型性能，同時(shí)將KV緩存存儲(chǔ)需求壓縮至原來的1/11。這種設(shè)計(jì)突破了傳統(tǒng)密集注意力機(jī)制對(duì)計(jì)算資源的依賴，在RULER長文測(cè)試中，即使大幅減少全注意力層數(shù)量，模型仍能穩(wěn)定捕捉長距離依賴關(guān)系，展現(xiàn)出混合結(jié)構(gòu)的獨(dú)特優(yōu)勢(shì)。

技術(shù)實(shí)現(xiàn)層面，HySparse引入hybrid block模塊化設(shè)計(jì)，每個(gè)模塊由1層全注意力層與N層稀疏注意力層構(gòu)成。其核心創(chuàng)新在于稀疏層不再獨(dú)立計(jì)算token重要性，而是直接復(fù)用全注意力層生成的KV緩存和關(guān)鍵token索引。這種設(shè)計(jì)充分利用了全注意力層在計(jì)算過程中自然產(chǎn)生的中間結(jié)果，避免了重復(fù)計(jì)算帶來的資源消耗，在保持性能的同時(shí)顯著降低了內(nèi)存占用。

相較于前代Hybrid SWA結(jié)構(gòu)，新架構(gòu)通過引入全局token信息補(bǔ)充機(jī)制，進(jìn)一步優(yōu)化了注意力分布。實(shí)驗(yàn)數(shù)據(jù)顯示，在70億參數(shù)密集模型和800億參數(shù)混合專家模型上，HySparse均帶來可觀測(cè)的性能提升。特別是在處理超長序列時(shí)，其稀疏層通過共享全注意力層的關(guān)鍵信息，既保證了重要上下文的完整保留，又通過稀疏計(jì)算降低了整體開銷。

該技術(shù)的突破為Agent應(yīng)用落地提供了重要支撐。在需要實(shí)時(shí)處理海量文本的場(chǎng)景中，HySparse架構(gòu)既能滿足模型對(duì)長上下文的理解需求，又能通過降低計(jì)算復(fù)雜度提升響應(yīng)速度。研究團(tuán)隊(duì)透露，后續(xù)將探索在更大規(guī)模模型上驗(yàn)證架構(gòu)極限，并嘗試進(jìn)一步減少全注意力層數(shù)量，推動(dòng)超長文本處理效率邁向新臺(tái)階。

02-07

光伏領(lǐng)域再掀波瀾！馬斯克力推特斯拉加速布局太陽能制造

02-07

特斯拉2026年在中國市場(chǎng)加碼布局：AI軟硬件與能源領(lǐng)域成投入新重點(diǎn)

02-07

阿里千問免單卡使用期延長至28日奶茶訂單量9小時(shí)破千萬引爆消費(fèi)熱潮

02-07

泡泡瑪特年會(huì)星光熠熠！王寧秀詠春，沈騰李誕齊聚引熱潮

02-07

2026年2月6日組訊速遞：多部劇集電影齊籌備，橫店成熱門拍攝地

免責(zé)聲明：戲客Seeker公眾號(hào)(“本平臺(tái)”)中全網(wǎng)組訊的信息、內(nèi)容(“組訊信息”，包括但不限于影視項(xiàng)目名稱、項(xiàng)目介紹信息、出品公司信息、導(dǎo)演信息、選角團(tuán)隊(duì)信息、拍攝相關(guān)信息、聯(lián)系方式等)均來源于內(nèi)容信息相…

02-07

谷歌調(diào)查：四成Android舊機(jī)安全告急，十億用戶陷換機(jī)或風(fēng)險(xiǎn)兩難境地

02-07

Crew-11緊急撤離后：美國2月11日將發(fā)射Crew-12 4名宇航員再赴空間站

02-07

2026年《機(jī)器人奇妙夜》節(jié)目單揭曉遠(yuǎn)征A2攜手黃曉明共獻(xiàn)科技盛宴

【太平洋科技】2026年2月6日消息，智元機(jī)器人將于2月8日晚舉辦全球首個(gè)大型機(jī)器人晚會(huì)《機(jī)器人奇妙夜》。官方公眾號(hào)智元AGIBOT今日公布的節(jié)目單顯示，旗下明星機(jī)器人“遠(yuǎn)征A2”將擔(dān)綱主理人，并邀請(qǐng)黃曉…

02-07

三星Galaxy S26系列現(xiàn)身WPC數(shù)據(jù)庫：支持Qi 2.2.1標(biāo)準(zhǔn) 需配磁吸殼實(shí)現(xiàn)無線充電

IT之家 2 月 7 日消息，型號(hào)為 SM-K772、SM-K777 和 SM-K778 的三款三星新機(jī)最近現(xiàn)身WPC（無線充電聯(lián)盟）數(shù)據(jù)庫，科技媒體 9To5Google 認(rèn)為這幾款新機(jī)分別是 Galax…

02-07

預(yù)算4000左右選二手iPhone？13 Pro 256G憑何成“閉眼入”的性價(jià)比之選？

iPhone 13 Pro 256GB 在二手市場(chǎng)被廣大用戶譽(yù)為 **“閉眼入的神機(jī)”** 和 **“性價(jià)比之王”**，其推薦度之高，背后有深刻的產(chǎn)品邏輯和市場(chǎng)原因。 * **縱向?qū)Ρ龋?* 它與后續(xù)的iP…

02-07

電商天才邵亦波：為愛放手易趣網(wǎng)，轉(zhuǎn)身離去卻意外鋪就馬云淘寶路

盡管當(dāng)時(shí)許多老師和同學(xué)認(rèn)為這幾乎是不可能的任務(wù)，但邵亦波憑借自己的努力和信念，最終如愿以償，成為了解放后第一位全額獎(jiǎng)學(xué)金進(jìn)入哈佛的中國學(xué)生。此外，邵振平還發(fā)明了一套撲克牌學(xué)習(xí)法，通過讓邵亦波計(jì)算撲克牌數(shù)字之…

02-07

問界M6申報(bào)信息曝光！標(biāo)配100度電池+滿配智駕，劍指25-30萬級(jí)市場(chǎng)

電動(dòng)知家消息，已經(jīng)預(yù)熱一段時(shí)間了的問界全新車型M6官方申報(bào)信息發(fā)布了。問界M6以年輕化設(shè)計(jì)切入25-30萬級(jí)市場(chǎng)紅海競(jìng)爭，旨在滿足年輕用戶需求，同時(shí)又以“標(biāo)配100度電池+滿配智駕”打破行業(yè)將電池容量作為高配…

02-07

新能源車事故頻發(fā)：隱藏式門把手成隱患，新國標(biāo)出爐能否破解困局？

根據(jù)調(diào)查認(rèn)定，本次事故是車輛與貨車高速碰撞后引發(fā)。：2024年，山西運(yùn)城一問界M7車輛高速追尾后，隱藏式門把手無法打開；2025年，小米SU7高速碰撞事故中，隱藏式門把手未被打開也成為外界的關(guān)注點(diǎn)之一。同時(shí)，…

02-07

珠影年貨節(jié)啟幕：借影視文旅融合之力繪就廣貨推廣新畫卷

作為“廣貨行天下”春季行動(dòng)的特色組成部分，珠影年貨節(jié)以“影視+文旅+消費(fèi)”的融合模式，為廣貨推廣開辟新路徑：既依托珠影星光城的文旅地標(biāo)屬性，承接“廣州過年、花城看花”的城市品牌流量；又以電影IP的傳播力擴(kuò)大廣…

02-07

點(diǎn)擊查看更多 +

全站最新

國產(chǎn)固態(tài)電池裝車東風(fēng)eπ008：續(xù)航破千公里，6分鐘快充，新能源市場(chǎng)新選擇？

固態(tài)電池真要“上車”了嗎？續(xù)航與安全雙提升，是未來還是泡沫？

電商天才邵亦波：為愛放手易趣網(wǎng)，轉(zhuǎn)身離去卻意外鋪就馬云淘寶路

問界M6申報(bào)信息曝光！標(biāo)配100度電池+滿配智駕，劍指25-30萬級(jí)市場(chǎng)

珠影年貨節(jié)啟幕：借影視文旅融合之力繪就廣貨推廣新畫卷

變革與堅(jiān)守并行：全新探岳L 以“智”變突圍，憑德系品質(zhì)筑牢市場(chǎng)根基

熱門內(nèi)容

本欄最新

電商天才邵亦波：為愛放手易趣網(wǎng)，轉(zhuǎn)身離去卻意外鋪就馬云淘寶路

問界M6申報(bào)信息曝光！標(biāo)配100度電池+滿配智駕，劍指25-30萬級(jí)市場(chǎng)

珠影年貨節(jié)啟幕：借影視文旅融合之力繪就廣貨推廣新畫卷

變革與堅(jiān)守并行：全新探岳L 以“智”變突圍，憑德系品質(zhì)筑牢市場(chǎng)根基

B站百萬粉絲UP主高若翔涉損害商品聲譽(yù)案開庭，律師作無罪辯護(hù)并申請(qǐng)取保候?qū)?/a>

寶馬2026中國布局：20款新車來襲，馬年版車型亮相，本地化再加碼

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.