中國電信廣東公司與阿里云攜手打造的重大科技項目——基于“真武”芯片的萬卡智算集群,近日在廣東韶關數據中心集群正式投入運營。這一成果標志著粵港澳大灣區在人工智能算力領域實現了全鏈路自主研發的突破,從底層芯片到上層應用均具備自主可控能力。
該集群在技術創新層面取得多項關鍵進展。通過采用卡間RoCE高性能組網技術和雙平面多軌通信架構,將端到端網絡時延壓縮至4微秒,網絡峰值利用率突破95%。這種設計有效解決了大模型訓練過程中AllReduce、AlltoAll等超大流量通信的瓶頸問題,能夠穩定支撐千億參數級大模型的預訓練與推理任務,為復雜AI應用提供了可靠的算力基礎。
在生態兼容性方面,“真武”芯片展現出強大的適配能力。其全面支持主流AI生態體系,自研軟件棧可高效兼容各類模型框架、算子庫及操作系統。通過提供統一的編程接口,該平臺能夠端到端支持用戶業務落地與功能擴展,顯著降低了企業遷移至新算力體系的成本門檻,為AI技術普及創造了有利條件。
為推動算力資源普惠化,項目方將集群資源接入“廣東電信算力超市”平臺,創新采用按卡、按小時計費的零售模式。這種集約化運營方式使中小企業能夠以靈活方式獲取高端算力服務。根據規劃,該集群未來將擴展至十萬卡規模,進一步降低大灣區科研機構、企業及政務部門的算力使用成本,提升區域整體AI應用效率。











