英偉達(dá)在人工智能基礎(chǔ)設(shè)施領(lǐng)域再度發(fā)力,其下一代AI系統(tǒng)Vera Rubin的研發(fā)與上市計(jì)劃引發(fā)行業(yè)高度關(guān)注。這款系統(tǒng)預(yù)計(jì)于今年晚些時(shí)候正式亮相,憑借每瓦性能較上一代Grace Blackwell產(chǎn)品提升10倍的顯著優(yōu)勢(shì),在人工智能基礎(chǔ)設(shè)施能效優(yōu)化方面實(shí)現(xiàn)重大突破,為AI產(chǎn)業(yè)邁向綠色高效發(fā)展提供了堅(jiān)實(shí)的技術(shù)支撐。
在加州總部舉辦的媒體采訪活動(dòng)中,英偉達(dá)AI基礎(chǔ)設(shè)施負(fù)責(zé)人迪翁·哈里斯向外界展示了Vera Rubin完整機(jī)架的內(nèi)部構(gòu)造及供應(yīng)商詳情。據(jù)介紹,該系統(tǒng)堪稱全球供應(yīng)鏈協(xié)同合作的典范,由130萬(wàn)個(gè)零部件精心組裝而成。其核心硬件部分,72顆Rubin圖形處理器(GPU)和36顆Vera中央處理器(CPU)主要由臺(tái)積電負(fù)責(zé)制造;而液冷組件、供電系統(tǒng)、計(jì)算托盤等其余零部件,則來(lái)自全球至少20個(gè)國(guó)家的80多家供應(yīng)商,中國(guó)也參與其中,充分彰顯了全球產(chǎn)業(yè)鏈在高端科技領(lǐng)域的緊密協(xié)作。
能效提升無(wú)疑是Vera Rubin的一大核心亮點(diǎn)。英偉達(dá)方面透露,該系統(tǒng)功耗約為上一代產(chǎn)品的兩倍,但得益于每瓦性能10倍的巨大提升,整體算力的能效比實(shí)現(xiàn)了質(zhì)的飛躍。在當(dāng)前能耗問(wèn)題成為人工智能基礎(chǔ)設(shè)施建設(shè)關(guān)鍵挑戰(zhàn)的背景下,這一突破有效化解了AI算力提升與能源消耗之間的矛盾,為行業(yè)的可持續(xù)發(fā)展提供了新的思路。
為滿足功耗提升帶來(lái)的技術(shù)需求,Vera Rubin成為英偉達(dá)首款實(shí)現(xiàn)100%液冷散熱的系統(tǒng)。迪翁·哈里斯介紹,英偉達(dá)已向客戶建議,未來(lái)人工智能工廠應(yīng)大規(guī)模采用液冷架構(gòu)。與傳統(tǒng)散熱方式相比,液冷閉環(huán)設(shè)計(jì)不僅散熱效率更高,還能有效節(jié)約水資源,實(shí)現(xiàn)了技術(shù)性能與綠色環(huán)保的完美平衡。
在數(shù)據(jù)傳輸方面,Vera Rubin同樣實(shí)現(xiàn)了技術(shù)升級(jí)。其搭載的NVLink芯片和機(jī)架主干數(shù)據(jù)傳輸速度翻倍,達(dá)到每秒260TB。為保障海量算力下的數(shù)據(jù)高速交互,單個(gè)機(jī)架內(nèi)部需通過(guò)5000根銅纜完成設(shè)備連接,總長(zhǎng)度約兩英里,確保了數(shù)據(jù)傳輸?shù)姆€(wěn)定與高效。
英偉達(dá)還展示了下一代大型機(jī)架Kyber的原型產(chǎn)品。該機(jī)架在GPU搭載數(shù)量上實(shí)現(xiàn)了大幅提升,從現(xiàn)有的72塊增加至288塊,算力承載能力顯著增強(qiáng),而重量?jī)H增加約50%。這一優(yōu)化得益于布線設(shè)計(jì)的精簡(jiǎn)升級(jí)。據(jù)悉,英偉達(dá)Vera Rubin Ultra系統(tǒng)將采用Kyber機(jī)架,預(yù)計(jì)于明年正式上市,有望進(jìn)一步提升AI超算的算力密度與運(yùn)行效率,為AI產(chǎn)業(yè)的未來(lái)發(fā)展注入新的動(dòng)力。











