英偉達公司正式推出其迄今為止性能最強的開源權重AI模型——Nemotron 3 Super。這款專為復雜智能體系統設計的模型擁有1200億參數,采用混合專家架構,在推理時僅激活120億參數,既保證了計算效率又降低了資源消耗。與完全閉源的GPT-4等模型不同,該模型將核心參數完全開放,允許開發者自由下載、運行及微調。
行業應用方面,Perplexity、Palantir和西門子等科技巨頭已率先將其引入核心業務場景。在搜索優化、軟件開發、電信網絡設計及半導體制造等領域,該模型展現出強大的任務處理能力,尤其擅長支撐自主智能體完成高精度復雜任務。其百萬Token的超大上下文窗口設計,有效解決了多智能體交互中常見的"上下文爆炸"問題,使工作流狀態保持完整,顯著降低多步推理成本。
技術架構實現多重突破。混合專家架構使模型吞吐量提升5倍,準確率較前代產品翻倍。創新性的Mamba層結構將內存與計算效率提高4倍,配合Transformer層的高級推理能力,形成高效協同。通過"潛在MoE"技術,模型能以單個專家的計算成本激活四個專家,配合多token預測功能使推理速度提升3倍。在英偉達Blackwell平臺上采用NVFP4精度運行時,內存需求較Hopper架構的FP8降低75%,推理速度提升4倍。
開源策略體現高度開放性。除公開模型權重外,英偉達同步發布了完整的訓練方法,包括超10萬億token的數據集構成和評估方案。該模型支持直接加載完整代碼庫進行端到端調試,也能瞬間處理數千頁規模的財務報告等長文本。開發者可通過Hugging Face平臺或谷歌云、甲骨文等云服務商獲取模型,AWS和Azure版本即將上線。
部署方案兼顧靈活性與便捷性。模型已封裝為NVIDIA NIM微服務,支持在本地數據中心和云端環境無縫部署。這種設計既滿足企業級應用對數據安全的要求,又為中小開發者提供了低成本接入途徑。混合專家架構的動態參數激活機制,使企業可根據實際需求靈活調整計算資源投入。











