在人工智能技術快速發展的背景下,全球算力需求結構正經歷深刻變革。以新一代智能代理應用為代表的推理場景爆發,推動行業重心從模型訓練向實時推理轉移。據德勤最新行業預測,到2026年,AI計算資源中用于模型推理的比例將攀升至三分之二,催生出價值數十億美元的專用優化芯片市場,部分產品的功耗水平甚至超越傳統通用芯片。
NVIDIA即將在加州圣何塞舉辦的GTC大會引發資本市場高度關注。公司創始人黃仁勛此前透露將推出"顛覆性"新品的消息,引發業界對技術路線的激烈討論。綜合多方分析,這款被推測為整合Groq語言處理單元(LPU)的推理芯片,可能采用三維堆疊架構實現性能突破。這種設計通過將SRAM存儲單元直接集成在GPU核心上方,有望解決傳統GPU架構中計算核心與高帶寬內存(HBM)間的數據傳輸瓶頸。
當前AI推理面臨的核心挑戰在于解碼階段的時延問題。傳統架構中,模型參數存儲在HBM中,計算單元與存儲器間的頻繁數據交換導致效率損失。Groq LPU創新性地采用片上SRAM存儲方案,其230MB容量即可提供80TB/s的內存帶寬,數據處理速度較GPU架構提升顯著。但行業專家指出,面對千億參數級大模型,純SRAM方案在存儲容量上存在根本性局限,這促使廠商探索混合架構解決方案。
云岫資本AI領域專家莊昌磊分析認為,英偉達可能借鑒AMD的3D V-Cache技術,通過臺積電系統集成芯片(SoIC)工藝,將包含大容量SRAM的LPU單元垂直堆疊在GPU晶圓上。這種設計既保留了GPU的軟件生態優勢,又吸收了LPU的架構特性。供應鏈消息顯示,最終產品可能采用"LPU+GPU+HBM"的三明治結構,其中HBM仍負責大容量存儲,而LPU單元專注提升解碼效率。
三維堆疊技術正在重塑半導體產業格局。AMD早在2021年就推出垂直緩存技術,富士通也于近期展示了3D SRAM處理器計劃。這種技術路線雖然解決了傳統SRAM的密度限制,但對晶圓制造精度提出極高要求。東方證券研究指出,SRAM堆疊需要在晶圓階段完成分子級鍵合,導致先進制程的價值進一步凸顯,可能加劇行業對3納米等尖端工藝的依賴。
產業變革帶來新的競爭態勢。技術門檻的提升可能使本土封測廠商在高端市場面臨挑戰,但同時也創造了差異化機遇。專家建議,國內企業可聚焦非尖端工藝的3D堆疊方案開發,或在測試、散熱等后端環節構建技術壁壘。中信證券研究顯示,未來GPU與神經網絡處理器(NPU)都可能采用類似設計,通過垂直堆疊SRAM實現帶寬飛躍,這預示著半導體價值鏈將持續向制造環節前移。











