英偉達(dá)近日宣布,其正在研發(fā)的下一代AI系統(tǒng)Vera Rubin已進(jìn)入上市籌備階段,預(yù)計(jì)于今年晚些時(shí)候正式亮相。這款系統(tǒng)在能效表現(xiàn)上取得重大突破,每瓦性能較前代Grace Blackwell產(chǎn)品提升10倍,為AI產(chǎn)業(yè)向綠色高效方向發(fā)展提供了關(guān)鍵技術(shù)支撐。據(jù)技術(shù)團(tuán)隊(duì)介紹,該系統(tǒng)通過架構(gòu)創(chuàng)新與制程優(yōu)化,在功耗翻倍的情況下實(shí)現(xiàn)了算力能效比的指數(shù)級(jí)躍升,有效緩解了AI算力擴(kuò)張與能源消耗之間的矛盾。
在硬件構(gòu)成方面,Vera Rubin展現(xiàn)了全球供應(yīng)鏈的深度協(xié)同。系統(tǒng)核心由72顆Rubin圖形處理器與36顆Vera中央處理器組成,均由臺(tái)積電采用先進(jìn)制程制造。其余130萬個(gè)零部件則來自全球20余個(gè)國(guó)家的80多家供應(yīng)商,涵蓋液冷組件、供電系統(tǒng)及計(jì)算托盤等模塊。中國(guó)供應(yīng)商在散熱管道、結(jié)構(gòu)件等關(guān)鍵領(lǐng)域參與其中,印證了高端科技領(lǐng)域跨國(guó)協(xié)作的緊密性。技術(shù)負(fù)責(zé)人特別強(qiáng)調(diào),該系統(tǒng)是首個(gè)實(shí)現(xiàn)100%液冷散熱的英偉達(dá)產(chǎn)品,其閉環(huán)液冷設(shè)計(jì)較傳統(tǒng)風(fēng)冷方案效率提升40%,同時(shí)減少30%的用水量。
數(shù)據(jù)傳輸能力的升級(jí)成為另一技術(shù)亮點(diǎn)。系統(tǒng)搭載的NVLink芯片與機(jī)架主干網(wǎng)絡(luò)將數(shù)據(jù)吞吐量提升至每秒260TB,較前代翻倍。為實(shí)現(xiàn)這一性能,單個(gè)機(jī)架內(nèi)部需部署5000根銅纜,總長(zhǎng)度接近兩英里。這種設(shè)計(jì)確保了288塊GPU協(xié)同工作時(shí)仍能保持低延遲數(shù)據(jù)交互,為大規(guī)模AI模型訓(xùn)練提供硬件基礎(chǔ)。
在系統(tǒng)架構(gòu)層面,英偉達(dá)同步展示了用于承載Vera Rubin Ultra的Kyber原型機(jī)架。該設(shè)計(jì)通過優(yōu)化布線系統(tǒng),在GPU數(shù)量增至288塊的情況下,將機(jī)架重量增幅控制在50%以內(nèi)。技術(shù)文檔顯示,新型機(jī)架采用三維布線技術(shù),使信號(hào)傳輸路徑縮短23%,同時(shí)通過模塊化設(shè)計(jì)降低了35%的組裝復(fù)雜度。這款機(jī)架計(jì)劃于明年投入商用,屆時(shí)將推動(dòng)AI超算中心向更高算力密度演進(jìn)。
行業(yè)分析師指出,Vera Rubin系統(tǒng)的推出恰逢全球AI算力需求激增期。據(jù)市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè),2024年全球數(shù)據(jù)中心電力消耗將突破4500億千瓦時(shí),能效優(yōu)化已成為制約行業(yè)發(fā)展的核心因素。英偉達(dá)此次通過芯片架構(gòu)、散熱系統(tǒng)與網(wǎng)絡(luò)協(xié)議的協(xié)同創(chuàng)新,為破解"算力-能耗"悖論提供了工程化解決方案,其技術(shù)路徑或?qū)⒁l(fā)行業(yè)跟風(fēng)效仿。











