中國電信廣東公司與阿里云攜手,在廣東韶關(guān)數(shù)據(jù)中心集群成功部署了“粵港澳大灣區(qū)首個基于‘真武’芯片的萬卡智算集群”。這一里程碑式的成果,標(biāo)志著我國在智算領(lǐng)域?qū)崿F(xiàn)了從芯片到云平臺,再到模型應(yīng)用的全鏈條自主研發(fā),為區(qū)域科技創(chuàng)新注入了強勁動力。
該集群在技術(shù)創(chuàng)新方面表現(xiàn)卓越。通過采用卡間RoCE高性能組網(wǎng)和雙平面多軌通信等前沿技術(shù),集群的端到端網(wǎng)絡(luò)時延被壓縮至4微秒以內(nèi),網(wǎng)絡(luò)峰值利用率更是突破了95%的大關(guān)。這一性能優(yōu)勢,使得集群能夠輕松應(yīng)對大模型訓(xùn)練過程中AllReduce、AlltoAll等超大流量通信需求,為千億參數(shù)級大模型的預(yù)訓(xùn)練與推理任務(wù)提供了穩(wěn)定可靠的支撐。
在生態(tài)兼容性上,“真武”芯片同樣展現(xiàn)出了強大的實力。它全面適配了主流AI生態(tài),自研軟件棧與各類主流模型、框架、算子庫及操作系統(tǒng)實現(xiàn)了高效對接。統(tǒng)一的編程接口設(shè)計,使得用戶能夠端到端地實現(xiàn)自主業(yè)務(wù)落地與擴展,大大降低了客戶遷移成本,為AI技術(shù)的廣泛應(yīng)用奠定了堅實基礎(chǔ)。
為了推動算力資源的普惠化,中國電信廣東公司還創(chuàng)新性地推出了“廣東電信算力超市”。該集群資源同步上線這一平臺,通過集約運營模式,面向中小企業(yè)提供按卡、按小時計費的靈活算力零售服務(wù)。這一舉措不僅降低了中小企業(yè)使用算力的門檻,還有助于提升區(qū)域整體算力資源的利用效率。未來,集群還計劃持續(xù)擴容至十萬卡規(guī)模,以更低成本、更高效率的服務(wù)惠及大灣區(qū)更多科研機構(gòu)、企業(yè)及政務(wù)部門。















