滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

小米MiMo發布HySparse架構：為Agent時代超長文本處理帶來高效新方案

時間：2026-02-08 08:19:08 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

在Agent模型與應用迅猛發展的當下，如何精準且高效地處理超長文本，已成為大模型領域亟待攻克的關鍵難題。Agent不僅要能在超長上下文中完成穩定的檢索、推理以及多輪規劃任務，還需在推理階段保持足夠快的響應速度。此時，最大的挑戰已從“能否計算”轉變為“能否算得起”。

面對這一挑戰，小米MiMo大模型團隊推出了HySparse架構，這是一種專為Agent時代打造的混合稀疏注意力架構。該架構采用“極少的全注意力（Full Attention）+ 稀疏注意力（Sparse Attention）”的核心設計理念，旨在實現效果與效率的完美平衡。

在多項通用、數學、代碼以及中文評測中，HySparse架構展現出了卓越的性能。無論是7B Dense規模還是80B MoE規模，HySparse均能為模型帶來顯著提升。以80B - A3B MoE模型實驗為例，在總共49層的模型中，HySparse僅保留5層Full Attention，卻依然能夠保持甚至提升模型的整體能力。同時，KV Cache存儲降低至原來的1/11，真正做到了在保證效果的同時大幅提升效率。

RULER長文測試的結果進一步證明了HySparse架構的優勢。即便將Full Attention層壓縮到極少數，該架構也能穩定地保持對長距離關鍵信息的訪問能力，充分彰顯了其混合稀疏結構的獨特魅力。

HySparse架構的創新之處在于其采用了hybrid block結構。每個hybrid block由1層Full Attention和N層Sparse Attention組成。在hybrid block內部，Sparse Attention層不再獨立進行token選擇和維護全量KV，而是直接復用前置Full Attention層生成的重要token索引和KV Cache。這一設計背后的邏輯在于，Full Attention在完成自身計算的同時，已經生成了KV Cache，并且計算出了最準確的token重要性信息，后續的N個Sparse Attention層自然可以直接復用這些信息。

可以認為，HySparse架構是在MiMo - V2 - Flash的Hybrid SWA結構基礎上進行的優化升級。它為SWA增加了全局的、更重要的token信息補充，這一改進不僅提升了模型性能，而且沒有增加KV Cache存儲，也沒有顯著增加計算開銷。

目前，小米MiMo團隊已計劃在更大規模的模型上進一步驗證HySparse架構的極限和潛力。同時，團隊還將持續探索降低Full Attention層數量的可能性，力求讓超長上下文的處理變得更加高效。HySparse架構為Agent時代的超長文本處理提供了高效精準的技術解決方案，也為大模型高效注意力結構的研究與落地提供了全新的參考范例。

更多>同類資訊

春晚機器人成“頂流”！多款被秒搶一空，62萬元高端款也瞬間售罄

如果我們能因為我們的一個作品，帶動了一個產業的勃興，帶動了一個領域的這種破圈的關注度，這個我覺得是每一個創作者的榮耀。” 據悉，從確定仿生人形機器人要登上春晚開始，僅經過兩個多月，松延動力就完成了從全棧自主研…

02-18

春晚“頂流”新歸宿！魔法原子“國寶熊貓機器人”57527元成交引關注

買家是一位來自北京的網友，在激烈競價中脫穎而出，將這件融合科技與萌寵元素的頂流“國寶熊貓機器人”收入囊中。在宜賓分會場，上百臺以“國寶熊貓”造型呈現的“MagicPanda”四足機器人上演了一場盛大表演，成…

02-18

春節零號灣“不打烊”：創業者于假期靜謐中，深挖技術、打磨產品謀新篇

鉅蛟光電創始人楊佳苗出現在辦公室，從教學、科研和管理的三重壓力中短暫抽身，他終于能定心坐下來，梳理新一年的學術方向與公司戰略。“國外走了幾十年，我們要填補他們在硬件上的優勢絕非一日之功，但可以用算法去補償硬件…

02-18

科沃斯T90與熱門掃地機器人大比拼：誰才是智能清潔的優選答案？

為了更好地了解T90的市場地位，我們將與以下幾款同類產品進行詳細對比：iRobotRoombai7、石頭科技S5Max、360掃地機器人和小米米家掃地機器人。總結來看，科沃斯T90憑借其智能導航、強勁清潔能力…

02-18

B站馬年春晚彈幕破億！“啊？”成熱門，“上B站看春晚”成新儀式

02-18

蘋果加速布局AI可穿戴領域：智能眼鏡、別針吊墜及攝像頭AirPods蓄勢待發

02-18

谷歌AI搜索功能升級，更突出展示信息來源鏈接

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發的竟是“啊”

02-18

豆包登頂蘋果App Store免費榜此前與春晚聯動互動總數達19億

02-18

消息稱蘋果正研發三款AI可穿戴設備：包括AI智能眼鏡等

02-18

馬斯克官宣 Grok 4.2 公開測試版上線，具備快速學習能力

02-18

B站春晚彈幕炸了！1.33億條里年輕人最愛發的竟是“啊”

02-18

馬年春節人形機器人“搶灘”租賃市場，行業能否借春晚東風再起飛？

02-18

特斯拉加州讓步：停用“Autopilot”宣傳，化解與車輛管理局長期糾紛

02-18

谷歌“Project Toscana”人臉識別系統來襲，有望解決低光解鎖難題挑戰蘋果Face ID

02-18

點擊查看更多 +

全站最新

日產奇駿海外煥新登場！澳洲市場燃油混動雙選，售價約18.6萬起

保時捷電動718或生變數奧迪高德諾確認“下一代TT”開發穩步推進

全合成機油分日系美系？別被誤導！選對關鍵看發動機要求

吉利銀河星耀6新版本亮相工信部，28.3千瓦時電池助力170公里純電續航

保時捷電動718存變數，奧迪“下一代TT”開發推進未來可期

奔馳全新概念車亮相，以現代設計重現1971年“紅豬”傳奇風采

熱門內容

本欄最新

春節不打烊：上海零號灣創業者借“窗口期”深耕技術，蓄勢待發迎新程

歲末冬日暖意濃廟壩鎮集體分紅繪就共富新篇章

馬斯克三度確認：特斯拉Cybercab 2026年4月投產初期產能或受限

全新奔馳GLA來襲：純電混動雙選擇，800V架構續航快充雙突破

假期租車出游全攻略：巧用規則租純電SUV，省錢又便利還超有趣

特斯拉Cybercab首輛量產車下線 2026年量產或成特斯拉產量最高車型

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

小米MiMo發布HySparse架構：為Agent時代超長文本處理帶來高效新方案