在近期舉辦的英偉達GTC大會上,一場以AI為核心的技術盛宴吸引了全球目光。英偉達創(chuàng)始人兼CEO黃仁勛在舞臺上展示了多項突破性成果,從芯片架構革新到AI代理生態(tài)構建,全面勾勒出人工智能發(fā)展的新圖景。其中,Vera Rubin平臺的發(fā)布被視為開啟Agentic AI(代理型AI)新時代的里程碑,其涵蓋的七款新芯片與五種機架系統(tǒng),標志著英偉達從單芯片競爭邁向全棧系統(tǒng)級解決方案。
Vera Rubin架構的核心突破在于“去PCIe化”的緊耦合設計。通過1.8 TB/s的NVLink-C2C技術,Vera CPU與Rubin GPU實現(xiàn)同封裝集成,單GPU在NVFP4精度下的推理算力達50 PFlops,訓練算力35 PFlops,能效較前代提升5倍。該架構專為長上下文推理設計,支持AI智能體處理數萬個Token的關聯(lián)分析,并配備硅光子技術(CPO)的Spectrum-X以太網交換機,單機柜內部互聯(lián)帶寬達260 TB/s,相當于全球互聯(lián)網跨境帶寬總和的數倍。首批合作客戶包括阿里巴巴、字節(jié)跳動、meta等科技巨頭,產品將于今年下半年開始供貨。
在芯片家族中,英偉達首次將Groq的LPU(語言處理單元)納入生態(tài)體系。通過200億美元戰(zhàn)略授權整合的Groq 3 LPX機架,包含256個LPU處理器與128GB片上SRAM,擴展帶寬達640 TB/s。與Vera Rubin NVL72協(xié)同工作時,GPU負責模型訓練與長文本預處理,LPU則專注實時推理,形成“訓練-推理”混合算力網絡。這種確定性流水線架構摒棄了傳統(tǒng)GPU的緩存管理與分支預測,將硬件復雜度轉移至編譯器層,使數據流動如精密傳送帶般穩(wěn)定,在自動駕駛、高頻交易等場景中實現(xiàn)毫秒級響應。
軟件生態(tài)層面,英偉達推出面向OpenClaw社區(qū)的NemoClaw軟件棧,為AI代理提供全生命周期支持。開發(fā)者可通過單條命令部署NVIDIA Nemotron模型與OpenShell運行時環(huán)境,后者提供的隔離沙箱確保AI代理在調用工具時遵循安全策略。該框架支持本地模型與云端模型的混合調用,既保護數據隱私,又可借助云端算力提升性能。目前,NemoClaw已適配GeForce RTX顯卡、DGX工作站等多平臺,為全天候運行的AI代理提供穩(wěn)定算力。
開放模型生態(tài)的擴展是另一重點。英偉達聯(lián)合全球AI實驗室成立Nemotron Coalition,推出Nemotron 3系列多模態(tài)模型,涵蓋Ultra、Omni和VoiceChat等版本。這些模型可同步處理語言、視覺與語音信息,支持AI代理從視頻、文檔中提取關鍵信息并完成復雜推理。在物理世界應用方面,NVIDIA Isaac GR00T N1.7模型賦能類人機器人感知與決策,Alpamayo 1.5模型通過多攝像頭支持提升自動駕駛推理能力,而即將發(fā)布的Cosmos 3模型則試圖統(tǒng)一世界生成、物理推理與行動仿真,為機器人訓練提供虛擬環(huán)境。
黃仁勛在演講中強調,AI時代的基礎設施正在從數據中心向“AI工廠”轉型,智能Token成為新貨幣。通過Vera Rubin DSX參考設計與Omniverse數字孿生藍圖,英偉達提供了一套構建高生產力AI工廠的解決方案。從芯片到系統(tǒng),從軟件到模型,這場技術革新不僅重新定義了AI算力的邊界,更推動人工智能從輔助工具向自主代理演進,為跨行業(yè)應用開辟了全新可能性。











