在人工智能技術(shù)從實驗室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵階段,算力供給模式的革新正引發(fā)行業(yè)深度變革。中科曙光近日在中關(guān)村論壇年會上推出全球首款無線纜箱式超節(jié)點(diǎn)scaleX40,這款集成40張GPU的算力設(shè)備以28PFLOPS(FP8精度)的算力表現(xiàn),為AI算力市場提供了新的解決方案。
傳統(tǒng)算力市場存在明顯的斷層:數(shù)百卡級超節(jié)點(diǎn)雖性能強(qiáng)勁但部署成本高昂,8卡服務(wù)器雖成本可控卻難以滿足新興應(yīng)用需求。中科曙光高級副總裁李斌指出,隨著OpenClaw等智能體技術(shù)推動AI應(yīng)用從對話交互向任務(wù)執(zhí)行轉(zhuǎn)型,算力需求正從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理服務(wù)主導(dǎo)。這種轉(zhuǎn)變要求算力基礎(chǔ)設(shè)施從"算力工廠"轉(zhuǎn)型為"Token工廠",在性能、成本與部署靈活性間尋找平衡點(diǎn)。
scaleX40的研發(fā)團(tuán)隊經(jīng)過市場調(diào)研發(fā)現(xiàn),40卡規(guī)模既能支撐大模型訓(xùn)練推理需求,又不會造成資源浪費(fèi)。該設(shè)備采用無線纜正交架構(gòu),通過計算節(jié)點(diǎn)與交換節(jié)點(diǎn)的直接對插設(shè)計,將訪存帶寬提升至80TB/s以上,延遲降低近一個數(shù)量級。這種創(chuàng)新架構(gòu)使設(shè)備可直接適配標(biāo)準(zhǔn)19英寸機(jī)柜,相比傳統(tǒng)超節(jié)點(diǎn)降低了80%的部署復(fù)雜度。
在性能對比測試中,scaleX40展現(xiàn)出顯著優(yōu)勢:其訓(xùn)練效率較5臺8卡服務(wù)器組合提升120%,推理性能最高提升330%,而硬件成本基本持平。這種突破得益于全棧協(xié)同優(yōu)化,配套發(fā)布的ParaStor分布式存儲系統(tǒng)、ScaleFabric高速網(wǎng)絡(luò)及SothisAI管理平臺,構(gòu)建起從存儲到應(yīng)用層的完整解決方案。系統(tǒng)出廠前已完成800余個大模型的適配優(yōu)化,開箱即可投入使用。
行業(yè)專家指出,當(dāng)前AI算力需求呈現(xiàn)明顯分層特征。智源研究院敖玉龍在研討中提到,科研機(jī)構(gòu)既需要單機(jī)般的易用性,又不得不面對大模型帶來的系統(tǒng)復(fù)雜性。中國電信王子瀟則預(yù)測,未來算力發(fā)展將呈現(xiàn)兩大趨勢:模型結(jié)構(gòu)收斂推動ASIC芯片發(fā)展,互連協(xié)議統(tǒng)一提升節(jié)點(diǎn)擴(kuò)展靈活性。這些變化都要求算力供給模式進(jìn)行適應(yīng)性調(diào)整。
中科曙光的產(chǎn)品矩陣布局印證了這種市場判斷。繼去年推出面向頂級訓(xùn)練的scaleX640后,此次發(fā)布的scaleX40形成了覆蓋訓(xùn)練到推理的全場景解決方案。李斌強(qiáng)調(diào),這種分層供給策略既符合國家算力中心建設(shè)"有序、集約、綠色"的指導(dǎo)原則,也體現(xiàn)了產(chǎn)業(yè)鏈協(xié)同創(chuàng)新的思路。通過與芯片廠商、系統(tǒng)軟件開發(fā)商的深度合作,設(shè)備在特定算子優(yōu)化上實現(xiàn)了30%以上的效率提升。
隨著AI技術(shù)加速滲透金融、醫(yī)療、制造等領(lǐng)域,算力可及性正成為制約產(chǎn)業(yè)智能化的關(guān)鍵因素。scaleX40的箱式設(shè)計使單臺設(shè)備占地面積縮減至0.5平方米,配合標(biāo)準(zhǔn)供電冷卻系統(tǒng),顯著降低了中小企業(yè)部署門檻。這種"普惠型"算力供給模式,或?qū)⑼苿覣I應(yīng)用從技術(shù)驗證階段邁向規(guī)模化產(chǎn)業(yè)落地。










