花旗最新研究報告顯示,英偉達在AI推理領域推出的創新存儲架構正引發NAND閃存市場連鎖反應。這項被稱為推理上下文內存存儲(ICMS)的技術方案,通過重構數據存儲層級,預計將在2026至2027年間為全球NAND市場注入數億TB級的新增需求,可能使當前已趨緊張的供需格局進一步惡化。
核心突破在于存儲層級的革命性重構。傳統Transformer模型依賴KV Cache機制實現內存優化,但英偉達新方案在原有GPU高速緩存(G1)、系統內存(G2)、本地SSD(G3)和企業存儲(G4)四層架構間,創造性地插入G3.5專用層級。該層級通過智能調度機制,將冷數據轉化為溫緩存,使數據傳輸效率提升5倍的同時,將每秒處理令牌數和能效比同步提高5倍。
硬件配置彰顯技術野心。即將搭載BlueField-4芯片的Vera Rubin平臺,單臺服務器配置72塊GPU,每塊GPU對應16TB專用TLC SSD存儲。這種配置使單臺設備NAND需求量達到驚人的1152TB,相當于傳統數據中心的百倍級存儲密度。花旗測算顯示,2026年若該平臺出貨量達3萬臺,將消耗全球2.8%的NAND產能;到2027年出貨量增至10萬臺時,占比將飆升至9.3%。
供需失衡風險持續累積。當前NAND市場已因AI數據中心建設陷入供應緊繃狀態,近三年價格累計漲幅超過40%。英偉達帶來的新增需求具有強剛性特征,其規模化落地將直接沖擊現有產能分配。報告特別指出,三星電子、SK海力士等頭部廠商的3D NAND產線擴建速度,可能無法匹配2026年后爆發的需求增長。
技術迭代催生產業變革。為應對AI推理場景的特殊需求,NAND技術正加速向更高存儲密度(單芯片1Tb級)、更快讀寫速度(4GB/s級)和更低功耗(每TB低于5W)進化。存儲控制器廠商已開始研發配套的拓撲感知調度芯片,SSD制造商則聚焦于提升數據持久性和訪問延遲優化。
產業鏈傳導效應顯著。從上游硅晶圓供應到下游系統集成,整個半導體生態都在調整布局。美光科技已宣布將2025年資本支出中的60%投向AI專用存儲產線,鎧俠則與英偉達聯合開發定制化固件算法。這種技術-產業協同效應,正在重塑全球存儲市場的競爭格局。
市場觀察人士指出,ICMS架構的推廣標志著AI算力發展進入存儲驅動新階段。當訓練階段的算力競賽逐漸趨緩,推理效率正成為新的競爭焦點。這種轉變不僅為NAND廠商創造結構性機遇,更可能催生存儲-計算一體化的新型硬件形態,推動整個半導體行業向更高維度進化。












