國(guó)家超算互聯(lián)網(wǎng)建設(shè)迎來(lái)重要里程碑。在河南鄭州舉行的國(guó)家超算互聯(lián)網(wǎng)應(yīng)用技術(shù)大會(huì)上,由中科曙光承建的鄭州核心節(jié)點(diǎn)正式啟動(dòng)試運(yùn)行,標(biāo)志著我國(guó)在人工智能算力基礎(chǔ)設(shè)施建設(shè)領(lǐng)域取得突破性進(jìn)展。該節(jié)點(diǎn)同步部署了3套萬(wàn)卡級(jí)超算集群,構(gòu)建起全國(guó)首個(gè)實(shí)際投入運(yùn)營(yíng)的3萬(wàn)卡國(guó)產(chǎn)AI算力池。
這個(gè)新型算力基礎(chǔ)設(shè)施具備三大核心優(yōu)勢(shì):其一,單節(jié)點(diǎn)規(guī)模突破3萬(wàn)張加速卡,算力密度達(dá)到國(guó)際領(lǐng)先水平;其二,全面支持萬(wàn)億參數(shù)大模型訓(xùn)練、高吞吐推理以及AI for Science等前沿計(jì)算場(chǎng)景;其三,通過(guò)異構(gòu)算力調(diào)度技術(shù),實(shí)現(xiàn)CPU、GPU、NPU等不同架構(gòu)加速卡的統(tǒng)一管理。中科曙光技術(shù)團(tuán)隊(duì)透露,該系統(tǒng)采用自主研發(fā)的互聯(lián)架構(gòu),有效解決了大規(guī)模集群的通信瓶頸問(wèn)題。
回顧建設(shè)歷程,2023年科技部牽頭組建的超算互聯(lián)網(wǎng)聯(lián)合體,為這項(xiàng)國(guó)家工程奠定了組織基礎(chǔ)。經(jīng)過(guò)近一年的技術(shù)攻關(guān),平臺(tái)于今年1月4日實(shí)現(xiàn)用戶規(guī)模突破百萬(wàn)的階段性目標(biāo)。目前已有14個(gè)省級(jí)行政區(qū)的30余家國(guó)家級(jí)超算中心、智算中心接入網(wǎng)絡(luò),整合形成包含15萬(wàn)張加速卡和200萬(wàn)處理器核心的異構(gòu)算力資源池,可提供近70種規(guī)格的彈性算力服務(wù)。
據(jù)國(guó)家高性能計(jì)算機(jī)工程技術(shù)研究中心介紹,鄭州核心節(jié)點(diǎn)的試運(yùn)行將重點(diǎn)驗(yàn)證三項(xiàng)關(guān)鍵技術(shù):跨中心算力調(diào)度、智能任務(wù)匹配和綠色節(jié)能運(yùn)行。該中心作為超算互聯(lián)網(wǎng)聯(lián)合體的理事長(zhǎng)單位,正牽頭制定算力交易、服務(wù)質(zhì)量等12項(xiàng)行業(yè)標(biāo)準(zhǔn),為構(gòu)建全國(guó)一體化算力網(wǎng)絡(luò)提供技術(shù)規(guī)范支撐。











