華為在近日舉辦的中國合作伙伴大會上,正式推出并展示了基于全新昇騰950PR處理器的AI訓(xùn)練推理加速卡Atlas 350,宣布該產(chǎn)品即日起進(jìn)入市場銷售。這款加速卡憑借其強(qiáng)大的算力性能和低精度數(shù)據(jù)支持能力,成為國內(nèi)AI計(jì)算領(lǐng)域的重要突破。
昇騰950PR芯片采用SIMD架構(gòu)設(shè)計(jì),在算力表現(xiàn)上達(dá)到1PFLOPS(FP8)和2PFLOPS(FP4),支持包括FP32、HF32、FP16在內(nèi)的九種數(shù)據(jù)格式。芯片互聯(lián)帶寬達(dá)2TB/s,配備128GB內(nèi)存容量和1.6TB/s帶寬,在低精度計(jì)算、向量處理能力和內(nèi)存訪問效率等關(guān)鍵指標(biāo)上實(shí)現(xiàn)顯著提升。與英偉達(dá)H20相比,其HBM容量提升至112GB,多模態(tài)生成速度提高60%,內(nèi)存訪問顆粒度優(yōu)化至128字節(jié),使小算子處理效率提升四倍。
Atlas 350加速卡在硬件參數(shù)上表現(xiàn)突出,F(xiàn)P4精度算力達(dá)1.56P,帶寬1.4TB/s,功耗控制在600W水平。華為昇騰計(jì)算業(yè)務(wù)負(fù)責(zé)人指出,該產(chǎn)品單卡算力是英偉達(dá)H20的2.87倍,作為國內(nèi)首款支持FP4低精度推理的解決方案,可顯著提升服務(wù)器對大模型的支持能力和推理響應(yīng)速度。實(shí)際測試數(shù)據(jù)顯示,在互聯(lián)網(wǎng)推薦場景中,該加速卡在時延控制和并發(fā)處理方面表現(xiàn)優(yōu)異,特別適用于短視頻推薦、電商廣告等高流量業(yè)務(wù)場景,其多模態(tài)處理能力已達(dá)到英偉達(dá)L20同等水平。
基于Atlas 350的服務(wù)器生態(tài)系統(tǒng)建設(shè)取得實(shí)質(zhì)性進(jìn)展。昆侖、華鯤振宇等七家核心合作伙伴同步推出搭載該加速卡的整機(jī)產(chǎn)品,標(biāo)志著昇騰950代際推理算力正式進(jìn)入商用階段。其中軟通動力發(fā)布的"超強(qiáng)A860 A5"服務(wù)器采用6U2路架構(gòu),可支持8塊Atlas 350加速卡,具備超強(qiáng)算力與靈活擴(kuò)展特性,適用于AI大模型訓(xùn)練、視頻分析等重負(fù)載場景。科大訊飛宣布其新一代星火大模型將與昇騰910/950系列算力底座深度適配,提供覆蓋行業(yè)需求的智能化解決方案。
在行業(yè)應(yīng)用層面,華為聯(lián)合20家頭部企業(yè)推出覆蓋政務(wù)、醫(yī)療、客服等領(lǐng)域的AI場景化解決方案。這些方案具有輕量化部署、快速落地和可復(fù)制推廣的特點(diǎn),有效解決傳統(tǒng)智能化改造周期長、實(shí)施復(fù)雜等痛點(diǎn)。針對近期興起的AI一體機(jī)市場需求,華為透露已有十余家合作伙伴推出基于昇騰架構(gòu)的OpenClaw一體機(jī)產(chǎn)品。目前昇騰生態(tài)已聯(lián)合打造400余款行業(yè)一體機(jī),服務(wù)客戶超過2700家,在國內(nèi)一體機(jī)市場占據(jù)主導(dǎo)地位。







