滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

顛覆！NVIDIA發明新技術KVTC：內存使用量縮減20倍

時間：2026-03-22 17:28:46 來源：快科技編輯：快訊 IP：北京 發表評論無障礙通道

3月22日消息，NVIDIA研究人員推出一項全新技術KVTC（KV快取轉換編碼），能把大型語言模型（LLM）追蹤對話歷史的內存用量，最高縮減20倍，而且不用修改模型本身。

這一突破有望解決大型語言模型長對話推理時的內存不夠用問題，大大降低企業使用AI的硬件成本，同時還能把模型首次生成回應的時間，最高提速8倍。

簡單來說，KVTC技術的核心就是壓縮大型語言模型背后的KV緩存——它相當于AI模型的“短期記憶”。我們可以把KV緩存理解成學生記筆記：模型處理對話時，會把關鍵信息（也就是Key和Value）記下來，下次生成回應時，不用從頭重新計算整段對話，響應速度就能大幅提升。

但問題是，對話越長，這份“筆記”就越大，甚至會膨脹到幾個GB，占用大量GPU內存，反而拖慢模型運行、限制其處理能力。

NVIDIA資深深度學習工程師Adrian Lancucki表示：“大型語言模型進行推論時，性能瓶頸往往不在運算能力，而在GPU內存。”那些暫時不用的KV緩存，會一直占用寶貴的GPU資源，逼得系統只能把它們轉移到CPU內存或硬盤里，這樣不僅會增加數據傳輸的負擔，還可能出現新的卡頓問題，這些額外成本最終也會體現在企業的使用費用中。

和現有壓縮技術相比，KVTC沒有那些明顯的局限，它借鑒了我們熟悉的JPEG圖片壓縮思路，通過“主成分分析、自適應量化、熵編碼”三個簡單步驟，就能實現高效壓縮。

更方便的是，這項技術不用改動模型的核心設置和代碼，屬于“非侵入式”設計，企業拿來就能快速部署。它的核心優勢是，能抓住KV緩存“數據高度相關”的特點，在保留關鍵信息的同時，去掉冗余數據，而且解壓時可以分塊、逐層進行，不會影響模型實時回應。

多輪測試顯示，KVTC的表現遠超現有主流方法。在參數量從15億到700億的多種模型（包括Llama 3系列、R1-Qwen 2.5等）上，即便將內存壓縮20倍，模型準確率也幾乎不受影響，損失不到1%，與未壓縮時相差無幾；而傳統壓縮方法僅壓縮5倍，就會出現明顯的準確率下降。

另外，在H100 GPU上處理8000個Token的提示時，不使用KVTC需要3秒才能生成第一個回應，使用后僅需380毫秒，提速整整8倍。

需要注意的是，KVTC更適合長對話、多輪互動場景，比如編程助手、迭代式代理推理等，若對話較短，很難發揮其壓縮價值。

目前，NVIDIA正計劃將這項技術整合進Dynamo框架的KV塊管理器，使其能與vLLM等主流開源推論引擎兼容。

業內人士認為，隨著大型語言模型可處理的對話長度不斷增加，KVTC這類標準化壓縮技術，未來可能會像視頻壓縮一樣普及，助力AI更廣泛地落地應用。

責任編輯：朝暉

更多>同類資訊

英特爾銳炫Arc Pro B70專業顯卡公版參考設計渲染曝光

03-22

階躍星辰接入微信生態，StepClaw“龍蝦”兩步裝進聊天框

03-22

黃仁勛騙了所有人，DLSS 5真是個純AI濾鏡

03-22

微信官宣ClawBot插件，可利用微信聊天調用「龍蝦」

03-22

OpenClaw爆火，AI Agent時代真的來了！

03-22

股價一年狂飆，鋰鹽巨頭仍被低估？

03-22

任澤平：缺電將是全球AI的最大瓶頸誰掌握了穩定、廉價且充沛的電力誰就掌握了高階AI的入場券

03-22

馬斯克：太空太陽能的成本低于地面太陽能

03-22

馬光遠：黃金創下43年來最大周跌幅機構還在瘋狂唱多背后可能正在悄悄出貨別在珠穆朗瑪峰上跳舞

03-22

巴倫投資：伊朗戰爭正在為煤炭注入新的活力

03-22

華燦光電：2025年凈虧損4.38億元

03-22

伊朗議員：伊朗正向部分船只收取200萬美元的通行費以允許其通過霍爾木茲海峽

03-22

新乳業：2025年凈利同比增35.98%，擬每10股派3.8元

03-22

諾華宣布加大在華投資預計將投入金額超過33億元

03-22

強腦科技韓璧丞：感謝馬斯克與奧特曼未來殘疾人可以用意念打字

03-22

點擊查看更多 +

全站最新

開放式耳夾耳機怎么選？虹覓Clip Pro、漫步者QQ夾、聲闊C30i實測對比，幫你精準避坑！

傳統批發企業破局之道：12個月線上突圍，營收躍升的實戰策略全解析

一個時代落幕？頂級游資大佬向量化投降！

起亞新獅鉑拓界合肥煥新登場！10.99萬起享全球品質與越級實力

從“老大哥”到被超越：一汽卡車為何難敵二汽東風的崛起之路？

五菱繽果S 525km旗艦款南京登場，長續航高配置開啟純電出行新體驗

熱門內容

本欄最新

一個時代落幕？頂級游資大佬向量化投降！

特朗普要伊朗48小時內開放霍爾木茲海峽否則打擊伊發電廠

貴陽銷售“神手”一搖，貴A·A88888豹子號現身，車主與銷售齊歡呼

伊朗發行面值1000萬里亞爾的紙幣

貴陽銷售“錦鯉附體” 搖中貴A·A88888豹子號車主與其齊呼“豹子”

世界濱海CBD豪宅的中國答案——深圳觀潮即將面市

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

顛覆！NVIDIA發明新技術KVTC：內存使用量縮減20倍