滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

內(nèi)存焦慮有救了！谷歌發(fā)布新型AI內(nèi)存壓縮技術

時間：2026-03-26 12:58:37 來源：快科技編輯：快訊 IP：北京 發(fā)表評論無障礙通道

3月26日消息，谷歌研究院推出全新AI內(nèi)存壓縮技術TurboQuant，精準破解AI推理的內(nèi)存瓶頸。

該技術可在不損失精度的前提下，將大語言模型緩存內(nèi)存占用至少縮減6倍，推理速度最高提升8倍。

AI模型運行時有一種“工作內(nèi)存”，即KV緩存（Key-Value Cache）。每當模型處理信息、生成回答時，KV緩存便會迅速膨脹，且上下文窗口越長，緩存占用的內(nèi)存越大。

這已成為制約AI系統(tǒng)效率與成本的核心瓶頸，并非模型不夠智能，而是運行時的內(nèi)存難以支撐。

TurboQuant采用向量量化的方法對緩存進行壓縮，使AI在占用更少內(nèi)存的同時記住更多信息，且保持準確性。實現(xiàn)這一效果的關鍵在于兩項技術：名為PolarQuant的量化方法，以及名為QJL的訓練與優(yōu)化手段。研究團隊計劃在下個月的ICLR 2026會議上正式發(fā)布相關成果。

研究團隊在Gemma和Mistral等開源大模型上進行了嚴格的基準測試。實驗數(shù)據(jù)顯示，TurboQuant無需任何預訓練或微調(diào)，即可將鍵值緩存高效壓縮至3比特，在“大海撈針”等長上下文測試中實現(xiàn)零精度損失，內(nèi)存占用降至原來的六分之一。

在H100 GPU加速器上，4比特TurboQuant的運行速度較未量化的32比特基準提升了高達8倍。

更多>同類資訊

AI短劇“卷”到一分鐘60元，卻沒誕生一個爆款

03-26

一老頭樂因?qū)＠鹪V小米汽車

03-26

谷歌發(fā)布AI內(nèi)存壓縮算法TurboQuant

03-26

Meta啟動「小企業(yè)」戰(zhàn)略，扎克伯格稱AI時代創(chuàng)業(yè)應該比以往更容易

03-26

Meta持續(xù)重組：周三裁員700人

03-26

我想過Sora會死，但沒想到這么快

03-26

黃仁勛喊出「推理拐點」，邊緣推理的機會窗口打開了嗎

03-26

OpenAI關閉Sora后，馬斯克宣布升級Grok視頻生成產(chǎn)品

03-26

蘋果獲得Gemini完整訪問權限訓練本地模型

03-26

拼多多：2025年全年營收4318億元，同比增長10%

03-26

TikTok準備自己做短劇了！正在招募演員

03-26

金山云：雷軍已辭任公司非執(zhí)行董事

03-26

羅永浩力挺楊笠：其段子無惡意，從沒想過制造男女對立

03-26

快手大跌13%

03-26

泡泡瑪特跌8%，兩天跌超30%

03-26

點擊查看更多 +

全站最新

全新騰勢Z9GT：以“續(xù)航、快充、操控”為刃，劍指中國車市新巔峰

鴻蒙向下滲透，汽車矩陣補全，華為新品能否撬動新市場？

REDMI Note 15 SE 4月2日印度登場紅色仿皮革后蓋配金色邊框引期待

小米汽車深陷專利風波：山東小廠對其前大燈及保險杠設計發(fā)起無效挑戰(zhàn)

小米新一代SU7磁吸玩偶成爆款！79元定價受熱捧官方緊急補貨滿足需求

新一代小米SU7首批交付獲贊：顏值吸睛，智能操控續(xù)航樣樣出眾

熱門內(nèi)容

本欄最新

鴻蒙向下滲透，汽車矩陣補全，華為新品能否撬動新市場？

REDMI Note 15 SE 4月2日印度登場紅色仿皮革后蓋配金色邊框引期待

小米汽車深陷專利風波：山東小廠對其前大燈及保險杠設計發(fā)起無效挑戰(zhàn)

小米新一代SU7磁吸玩偶成爆款！79元定價受熱捧官方緊急補貨滿足需求

新一代小米SU7首批交付獲贊：顏值吸睛，智能操控續(xù)航樣樣出眾

從演員到導演華麗轉(zhuǎn)身！舒淇首部自編自導作品連獲大獎雷軍發(fā)文祝賀

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

內(nèi)存焦慮有救了！谷歌發(fā)布新型AI內(nèi)存壓縮技術