在華為中國合作伙伴大會2026期間,昇騰人工智能伙伴峰會成為行業焦點。華為副總裁、ICT產品組合管理與解決方案部總裁馬海旭在會上宣布,搭載全新昇騰950PR(Ascend 950PR)處理器的Atlas 350加速卡正式推向市場。這款硬件產品的問世,標志著昇騰950代際首款產品完成商業化落地,為人工智能推理場景注入新動能。
據官方技術披露,Atlas 350加速卡在核心性能上實現三大突破:算力密度較前代產品提升40%,內存帶寬增長35%,同時支持更靈活的訪存模式。其處理器架構針對推薦推理、多模態生成和LLM(大語言模型)推理三大場景進行深度優化,開發者可通過統一編程框架實現跨場景部署。華為昇騰計算業務總裁張迪煊特別強調,該產品是國內首款支持FP4低精度計算的推理硬件,在特定場景下可將多模態生成速度提升60%。
在硬件規格層面,Atlas 350展現出顯著競爭優勢。實測數據顯示,其單卡FP4精度算力達1.56P,帶寬突破1.4TB/s,HBM(高帶寬內存)容量配置112GB,較國際同類產品提升16%。內存訪問顆粒度從512字節壓縮至128字節,使得小算子訪存效率提升4倍。盡管600W的功耗較競品高出50%,但單位算力能效比仍保持行業領先水平。
產業生態建設同步提速。昆侖、華鯤振宇、神州鯤泰等七家核心合作伙伴在峰會現場發布基于Atlas 350的整機解決方案,覆蓋智慧城市、智能制造、金融科技等領域。這些定制化設備將深度整合華為昇騰的異構計算架構,通過軟硬協同優化實現推理延遲降低30%,系統吞吐量提升2倍。合作伙伴代表透露,首批行業解決方案已完成驗證測試,預計二季度實現規模化商用部署。
技術專家指出,Atlas 350的上市標志著國產AI推理硬件進入新的發展階段。其支持的FP4低精度計算技術,不僅可降低模型部署成本,還能通過量化感知訓練保持模型精度。在LLM推理場景中,該技術可使單卡支持的并發用戶數提升2.5倍,特別適用于對話式AI、智能客服等高并發應用場景。隨著生態伙伴解決方案的陸續落地,國產AI基礎設施的自主化程度將進一步提升。









