在華為中國合作伙伴大會2026上,一款備受矚目的AI訓練推理加速卡Atlas 350正式亮相。這款加速卡搭載了華為全新研發(fā)的昇騰950PR(Ascend 950PR)處理器,標志著華為在人工智能芯片領域又邁出了重要一步。
與前代昇騰芯片相比,昇騰950PR在多個關鍵性能指標上實現(xiàn)了顯著提升。特別是在低精度數(shù)據(jù)格式處理、向量算力、互聯(lián)帶寬以及自研高帶寬內存(HBM)方面,昇騰950PR展現(xiàn)出了強大的技術實力。這些提升使得Atlas 350在AI訓練和推理任務中能夠更加高效地運行。
據(jù)華為昇騰計算業(yè)務總裁張迪煊介紹,Atlas 350在單卡算力上達到了驚人的水平,是英偉達H20的2.87倍。這一數(shù)據(jù)表明,Atlas 350在處理復雜AI任務時具有更高的效率和更快的速度。同時,Atlas 350還是目前國內唯一支持FP4低精度的推理產(chǎn)品,這一特性使得它在處理特定類型的AI任務時具有獨特的優(yōu)勢。
除了強大的算力外,Atlas 350在內存配置方面也表現(xiàn)出色。其HBM容量達到了112GB,是H20的1.16倍。這一配置使得Atlas 350在處理大規(guī)模數(shù)據(jù)時能夠更加游刃有余。同時,多模態(tài)生成速度的提升也達到了60%,進一步增強了其在AI應用中的實用性。內存訪問顆粒度的減小也顯著提高了小算子的訪存效率,使得Atlas 350在處理細粒度任務時更加高效。
在大會展廳的Atlas 350展臺上,華為公布了更多關于這款加速卡的詳細參數(shù)。Atlas 350的FP4精度算力為1.56P,帶寬達到了1.4TB/s,這些數(shù)據(jù)進一步證明了其在AI領域的強大實力。然而,高功耗也是Atlas 350需要面對的挑戰(zhàn)之一,其功耗為600W,是H20的1.5倍。盡管如此,華為表示將通過優(yōu)化設計和散熱技術來降低功耗對整體性能的影響。
Atlas 350不僅支持FP16和FP8等常見精度格式,還支持更低精度的FP4。這一特性使得集成Atlas 350的服務器能夠支持更大規(guī)模的模型以及更低時延的推理任務。由于精度降低,計算速度得以加快,同時寄存器效率也得到了提升。這對于需要處理大量數(shù)據(jù)和復雜模型的AI應用來說具有重要意義。
張迪煊表示,基于Atlas 350等產(chǎn)品,華為將結合AI發(fā)展趨勢和客戶需求,打造大、中、小三大核心算力場景。這一戰(zhàn)略旨在幫助合作伙伴滿足不同場景下的差異化需求,共同深耕行業(yè)智能化領域。通過提供多樣化的算力解決方案,華為有望進一步鞏固其在AI芯片市場的領先地位。











