在AI算力需求持續(xù)攀升的背景下,我國智算基礎(chǔ)設(shè)施領(lǐng)域迎來關(guān)鍵突破。中科曙光近日宣布,成功研制出國內(nèi)首款全棧自研的400G無損高速網(wǎng)絡(luò)系統(tǒng)——scaleFabric,該系統(tǒng)基于原生RDMA架構(gòu)打造,實現(xiàn)了從底層IP核到上層管理軟件的100%自主可控,為超大規(guī)模智算集群提供了高性能網(wǎng)絡(luò)解決方案。
當(dāng)前,萬卡級智算集群已成為AI大模型訓(xùn)練的主流形態(tài)。研究數(shù)據(jù)顯示,在分布式訓(xùn)練場景中,網(wǎng)絡(luò)通信耗時占比高達(dá)30%-50%,網(wǎng)絡(luò)性能直接決定算力系統(tǒng)的整體效率。作為提升通信效率的核心技術(shù),RDMA網(wǎng)絡(luò)憑借零丟包、高帶寬、低延遲等特性,被全球頂級超算中心廣泛采用。據(jù)TOP500榜單統(tǒng)計,全球約60%的高性能計算系統(tǒng)采用InfiniBand網(wǎng)絡(luò)架構(gòu),但該領(lǐng)域的關(guān)鍵技術(shù)長期被海外廠商壟斷。
中國工程院院士鄔賀銓在視頻致辭中強調(diào):"高速網(wǎng)絡(luò)是算力基礎(chǔ)設(shè)施的'神經(jīng)中樞',其自主可控性直接關(guān)系到國家算力安全與發(fā)展質(zhì)量。面對大模型訓(xùn)練對網(wǎng)絡(luò)提出的超低延遲、超高帶寬、無損傳輸?shù)葒?yán)苛要求,發(fā)展自主RDMA技術(shù)已成為產(chǎn)業(yè)界的共識。"
scaleFabric系統(tǒng)的研發(fā)突破了多重技術(shù)壁壘。該系統(tǒng)構(gòu)建了完整的自主技術(shù)體系,涵蓋112G SerDes IP核、交換芯片、網(wǎng)卡、交換機等核心硬件,以及驅(qū)動與管理軟件。在性能指標(biāo)上,400系列網(wǎng)卡采用PCIe5.0接口,端口帶寬達(dá)400Gbps,端到端時延低至0.9微秒;交換機單端口帶寬800Gbps,整機交換容量雙向64Tbps,交換時延約260納秒,支持800G×40或400G×80端口擴(kuò)展,可滿足萬卡級集群的通信需求。
在穩(wěn)定性與擴(kuò)展性方面,該系統(tǒng)采用信用制無損流控機制,從根源上避免擁塞丟包,鏈路故障恢復(fù)時間小于1毫秒。經(jīng)近萬卡集群長達(dá)10個月的穩(wěn)定運行驗證,其交換機端口密度較英偉達(dá)NDR提升25%,網(wǎng)卡最大QP數(shù)支持提升100%,單子網(wǎng)互連規(guī)模達(dá)傳統(tǒng)IB的2.33倍,可支撐最大11.4萬卡集群部署,同時網(wǎng)絡(luò)總成本降低30%。
實際應(yīng)用層面,scaleFabric已部署于國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點,支撐三套總規(guī)模達(dá)3萬卡的scaleX智算集群穩(wěn)定運行。中科曙光高級副總裁李斌透露,該系統(tǒng)成功支持跨POD組網(wǎng)及大規(guī)模并行訓(xùn)練任務(wù),驗證了國產(chǎn)原生RDMA技術(shù)在高端智算場景的可行性。隨著產(chǎn)品在超大規(guī)模集群中的落地,圍繞scaleFabric的高性能網(wǎng)絡(luò)產(chǎn)業(yè)生態(tài)正在加速形成。
此次突破標(biāo)志著我國在智算互聯(lián)領(lǐng)域形成自主技術(shù)路徑。依托在計算、存儲、網(wǎng)絡(luò)領(lǐng)域的長期積累,中科曙光已構(gòu)建起"算-存-網(wǎng)"協(xié)同發(fā)展的完整算力底座,為AI基礎(chǔ)設(shè)施提供系統(tǒng)級支撐。在"人工智能+"戰(zhàn)略推動下,算力基礎(chǔ)設(shè)施正進(jìn)入升級周期,國產(chǎn)原生RDMA網(wǎng)絡(luò)的落地補齊了我國智算產(chǎn)業(yè)鏈的關(guān)鍵環(huán)節(jié)。











