滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek再發(fā)新論文，DualPath架構(gòu)如何將推理吞吐量提升近2倍？

時間：2026-02-28 03:25:48 來源：TechWeb編輯：快訊 IP：北京 發(fā)表評論無障礙通道

2月27日消息，就在外界翹首期盼DeepSeek-V4大模型發(fā)布之際，DeepSeek團隊再次帶來了一份技術(shù)驚喜。

論文開篇指出了一個重要趨勢：LLM正在從單輪對話機器人演變?yōu)槟軌蜃灾饕?guī)劃、調(diào)用工具、解決現(xiàn)實世界任務(wù)的Agentic系統(tǒng)。在這種新范式下，模型不再處理孤立的提示詞，而是參與長達數(shù)十甚至數(shù)百輪的長期會話，上下文不斷累積。

這種變化帶來了全新的計算特征：高KV-Cache（鍵值緩存）命中率、低計算需求。論文中的數(shù)據(jù)顯示，在典型的編碼任務(wù)軌跡中，平均輪次達到157輪，平均上下文長度32.7K tokens，而每次追加的平均長度僅429 tokens，這意味著KV-Cache命中率高達98.7%。

這種“長上下文、短追加、多輪次”的工作負載模式，使得KV-Cache的加載效率而非計算效率成為主導(dǎo)性能的關(guān)鍵因素。

現(xiàn)有架構(gòu)的致命弱點

當(dāng)前主流的LLM推理系統(tǒng)普遍采用預(yù)填充-解碼分離架構(gòu)。在這種設(shè)計中，預(yù)填充引擎負責(zé)從分布式存儲加載KV-Cache，然后傳輸給解碼引擎進行自回歸生成。

然而，論文揭示了一個嚴重的資源利用不平衡問題：預(yù)填充引擎的存儲網(wǎng)絡(luò)帶寬成為整個系統(tǒng)的吞吐瓶頸，而解碼引擎的存儲網(wǎng)絡(luò)帶寬卻基本閑置。

更令人擔(dān)憂的是硬件發(fā)展趨勢。論文數(shù)據(jù)顯示，從NVIDIA Ampere架構(gòu)到Blackwell架構(gòu)，I/O與計算的比例下降了14.4倍。這意味著GPU算力增長遠快于網(wǎng)絡(luò)帶寬和HBM容量的增長，導(dǎo)致I/O瓶頸問題日益嚴重。

面對這一挑戰(zhàn)，DeepSeek團隊提出了一個反直覺的解決方案：讓KV-Cache加載不再局限于預(yù)填充引擎。

實現(xiàn)這一設(shè)計面臨三個關(guān)鍵挑戰(zhàn)：

推理吞吐量提升近2倍

論文在三個模型上進行了全面評估：DeepSeek-V3.2 660B、一個27B的降規(guī)模版本以及Qwen2.5-32B。

同時，論文也指出了未來工作方向：更自適應(yīng)、更靈活的并行度和預(yù)填充-解碼比例配置方法，以及在大規(guī)模部署中實現(xiàn)更低的TTFT（Time To First Token）百分位數(shù)。

02-28

新加坡國立大學(xué)新成果：NoLan讓AI視覺描述告別“幻覺”時代

02-28

ByteDance與港大聯(lián)手：WoG技術(shù)賦能機器人“預(yù)見未來”精準決策

02-28

AI深度研究大揭秘：愛丁堡大學(xué)解鎖搜索引擎“適配密碼”

02-28

雙曲幾何新突破：澳洲與阿聯(lián)酋高校聯(lián)手為AI規(guī)劃打開幾何學(xué)新大門

02-28

無需專家示范！特倫托大學(xué)與中山大學(xué)新研究解鎖自動駕駛安全學(xué)習(xí)新路徑

02-28

芯動科技武漢發(fā)布全球首創(chuàng)120通道PCIe Gen5芯片助力高性能計算升級

02-28

豆包手機助手回應(yīng)安全漏洞質(zhì)疑：系黑公關(guān)炒作已升級防護并取證

02-28

國際高校聯(lián)手創(chuàng)新：JavisDiT++攻克音視頻同步難題開啟AI創(chuàng)作新篇章

02-28

寶馬德國工廠引入人形機器人：降本增效，改善環(huán)境，未來或承擔(dān)更多生產(chǎn)任務(wù)

02-28

新版ChatGPT現(xiàn)成人模式代碼，18歲以上開放且需身份驗證引關(guān)注

02-28

飛榮達布局機器人領(lǐng)域：二十多家客戶獲認證多款產(chǎn)品推進中

02-28

杰克·多西旗下金融科技公司Block裁員40%，借AI重構(gòu)運營模式謀發(fā)展

02-28

千問官方發(fā)布新通知：免單卡使用期限延長至3月3日24點

02-28

李想談AI時代：頂級專家擁抱Agent價值飆升普通水平者競爭力堪憂

02-28

點擊查看更多 +

全站最新

廣汽2025年成績斐然：與華為合作、自主品牌發(fā)力，邁向高質(zhì)量發(fā)展新征程

亞馬遜500億美元攜手OpenAI，共筑AI新生態(tài)與定制化模型未來

極狐新阿爾法S5：陳妍希同款時尚座駕，L3智駕或引領(lǐng)出行新潮流

陳妍希米蘭閃耀，極狐新阿爾法S5登場，時尚科技共譜生活新篇

尊界S800新激光雷達亮相，以科技革新定義“科技豪華”新范式

極氪8X攜G-ASD來襲：以新能源之姿，改寫豪華高性能SUV市場格局

熱門內(nèi)容

本欄最新

極氪8X攜G-ASD來襲：以新能源之姿，改寫豪華高性能SUV市場格局

豐田鉑智7來襲！3月5日預(yù)售，20萬級配華為座艙Momenta智駕

螞蟻集團注冊“ROBBYANT”商標，旗下首款人形機器人已在多場景試點應(yīng)用

李想談AI Agent：使用效果兩極分化，善用者職場競爭力飆升

螞蟻集團注冊“ROBBYANT”商標，旗下首款人形機器人已試點應(yīng)用

成都經(jīng)開區(qū)捷達科技加速轉(zhuǎn)型 70%本地配套純電新車9月將下線

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek再發(fā)新論文，DualPath架構(gòu)如何將推理吞吐量提升近2倍？