格隆匯2月27日|DeepSeekV4發(fā)布前夕硬核重磅論文上線。DeepSeek聯(lián)合北大、清華研究團隊提出了一種全新的大模型推理系統(tǒng)——DualPath。該系統(tǒng)通過引入“雙路徑KV-Cache加載”機制,巧妙利用了集群中閑置的網(wǎng)絡(luò)帶寬,將Agentic大模型負載的離線推理吞吐量提升了最高1.87倍,在線服務(wù)吞吐量平均提升了1.96倍。目前,這項研究已在包含多達1152張GPU的集群上完成了大規(guī)模驗證,支持DeepSeek-V3.2660B等頂級大模型。








