滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

小米MiMo推出HySparse——面向Agent時代的混合稀疏注意力架構(gòu)

時間：2026-02-09 20:34:24 來源：鞭牛士編輯：快訊 IP：北京 發(fā)表評論無障礙通道

2026年2月6日，小米MiMo大模型團(tuán)隊宣布推出HySparse——一種面向 Agent 時代的混合稀疏注意力架構(gòu)，創(chuàng)新使用“極少的全注意力（Full Attention）+ 稀疏注意力（Sparse Attention）”核心設(shè)計，為 Agent 時代的超長文本處理提供了高效精準(zhǔn)的技術(shù)解決方案，也為大模型高效注意力結(jié)構(gòu)的研究與落地提供了全新參考。

隨著 Agent 模型與應(yīng)用的爆發(fā)式發(fā)展，精準(zhǔn)高效處理超長文本正在成為模型必不可少的基礎(chǔ)能力。Agent時代的“富貴病”問題，已經(jīng)變得極為突出。Agent 不僅需要在超長上下文中完成穩(wěn)定的檢索、推理與多輪規(guī)劃，還必須在推理階段保持足夠快的響應(yīng)速度，目前最大的挑戰(zhàn)已經(jīng)不只是 “能不能算”，而是 “算不算得起”。

為此，小米MiMo提出了全新的HySparse架構(gòu)，以解決上述行業(yè)難題。在多項通用、數(shù)學(xué)、代碼和中文評測中，HySparse 在 7B Dense 和 80B MoE 兩種規(guī)模均帶來穩(wěn)定提升。其中，在總共 49 層的 80B-A3B MoE 模型實(shí)驗中，僅保留 5 層 Full Attention 仍能保持甚至提升模型能力，帶來了接近 10×的 KV Cache 存儲降低，實(shí)現(xiàn)效果與效率的兼顧；RULER 長文測試表明，HySparse 即便將 Full Attention 層壓到極少，也能穩(wěn)定保持長距離關(guān)鍵信息訪問，充分展現(xiàn)了其混合稀疏結(jié)構(gòu)的優(yōu)勢。

HySparse的推出，標(biāo)志著大模型在“能不能算”向“算不算得起”的關(guān)鍵轉(zhuǎn)變中，正邁出重要一步。

作為小米 MiMo 在混合注意力架構(gòu)上的重要技術(shù)迭代，HySparse 是對 MiMo-V2-Flash 的 Hybrid SWA 結(jié)構(gòu)的又一次全新升級。HySparse 可以視為在 Hybrid SWA 的基礎(chǔ)上，為 SWA 增加了全局的、更重要的 token 信息補(bǔ)充，實(shí)現(xiàn) “兼容且互補(bǔ)”。這一改進(jìn)不僅提升了性能，還沒有增加 KV Cache 存儲，也沒有顯著增加計算開銷。

小米MiMo表示，計劃在更大規(guī)模模型上進(jìn)一步驗證HySparse的極限和潛力，并持續(xù)探索降低Full Attention層數(shù)量的可能性，讓超長上下文更高效，并為學(xué)術(shù)界和工業(yè)界在混合稀疏注意力方向的研究提供一些參考和啟發(fā)。

02-09

千問官方提醒：目前免單卡買天貓超市、盒馬更順暢

02-09

米蘭冬奧AI智能徽章交換站成運(yùn)動員打卡熱點(diǎn)

02-09

董宇輝賣春聯(lián)炸上熱搜，「人設(shè)」崩塌！

02-09

高途陳向東力贊俞敏洪：具備頂級企業(yè)家領(lǐng)導(dǎo)力

02-09

小紅書正研發(fā)視頻剪輯類AI產(chǎn)品OpenStoryline

02-09

羅永浩分享與AI的日常驚悚對話：人類作家一定會被淘汰

02-09

小米汽車又一新專利獲得授權(quán) 可實(shí)現(xiàn)車輛的無序開門

02-09

小紅書正研發(fā)視頻剪輯類AI 命名“OpenStoryline”

02-09

雷軍小年直播定檔2月10日晚8點(diǎn)舉行，和大家一起迎春節(jié)

02-09

豐田與小馬智行合作的鉑智4X Robotaxi量產(chǎn)下線，今年擬部署千臺

02-09

雷軍不該遭詆毀！《人民網(wǎng)》為小米2200MPa超強(qiáng)鋼點(diǎn)贊

02-09

小米MiMo推出HySparse：Agent時代的混合稀疏注意力架構(gòu)

02-09

阿里新一代模型Qwen3.5曝光

02-09

Waymo發(fā)布世界模型，可模擬龍卷風(fēng)等異常罕見事件

02-09

點(diǎn)擊查看更多 +

全站最新

2026年鈉電池蓄勢待發(fā)：技術(shù)突破與場景落地雙輪驅(qū)動產(chǎn)業(yè)突圍

離岸人民幣兌美元升破6.92，創(chuàng)2023年5月以來新高

美股異動丨騰訊音樂盤前續(xù)漲超1% 花旗料其上季業(yè)績符預(yù)期或略勝預(yù)期

ETF視角下的A+H科技新圖景

美股異動丨禮來盤前漲2.2% 高盛看高其目標(biāo)價至1260美元重申 “買入”評級

美股異動丨文遠(yuǎn)知行盤前續(xù)漲超1% 與Uber合作拓中東市場獲摩通看好

熱門內(nèi)容

本欄最新

工業(yè)制造企業(yè)必看！百度競價運(yùn)營服務(wù)商實(shí)力解析與選型指南

馬斯克透露：蘋果“Project Titan”期間高薪挖角特斯拉工程師，遭果斷拒接電話

2026 PQQ選購指南：十大品牌實(shí)測揭秘成分純度與臨床數(shù)據(jù)雙保障

情感營銷+全渠道布局+產(chǎn)業(yè)鏈賦能：十月稻田如何筑牢長期增長基石？

千億零售巨頭高鑫零售“風(fēng)暴”來襲：新CEO上任倆月失聯(lián)，轉(zhuǎn)型路在何方？

小米YU7 GT現(xiàn)身工信部：超千馬力+紐北測試，性能車市場要變天？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

小米MiMo推出HySparse——面向Agent時代的混合稀疏注意力架構(gòu)