在巴塞羅那舉行的MWC 2026世界移動通信大會期間,華為數據存儲產品線總裁袁遠于產品與解決方案發布會上宣布,正式推出全新AI數據平臺。該平臺旨在破解當前AI應用在運營商核心業務中落地難的痛點,通過技術創新提升推理環節的效率與可靠性。
當前,AI技術在運營商領域的應用普遍面臨“重訓練、輕推理”的困境。盡管模型訓練能力持續提升,但推理環節仍存在幻覺頻發、響應延遲、記憶缺失等問題,導致AI難以深度融入核心業務場景。華為此次推出的“3+1”架構AI數據平臺,通過針對性優化知識存儲、緩存管理和記憶機制,為行業提供了系統性解決方案。
平臺核心包含三大基礎能力與一項調度技術。在知識處理方面,通過多模無損解析技術將文本、圖像、視頻等數據轉化為細粒度知識單元,結合多維度檢索算法,在智能查詢場景中實現超過95%的檢索準確率。例如在客服場景中,系統可精準識別用戶需求,避免因信息理解偏差導致的無效交互。
針對推理效率優化,平臺采用PB級KV Cache技術構建歷史數據緩存池。該技術不僅支持單次對話中上下文窗口的動態擴展,更可在多輪對話中智能復用歷史緩存數據,避免重復計算。實測數據顯示,首Token生成時延降低達90%,顯著提升模型響應速度,特別適用于高并發客服場景。
記憶管理機制是平臺的另一創新點。通過構建結構化記憶庫,系統可自動萃取業務場景中的歷史數據與經驗,形成可追溯的記憶單元。在商業數據分析場景中,這種機制使模型能夠基于歷史案例進行類比推理,隨著使用頻次增加,推理精準度持續提升,實現“越用越聰明”的自我進化能力。
支撐三大能力協同運作的是UCM(Unified Context Management)推理記憶數據管理技術。該技術采用三層緩存架構,對知識庫、KV Cache和記憶庫進行分級存儲與智能調度。通過動態分配計算資源,確保不同業務場景下推理任務獲得最優支持,同時降低整體能耗。
為滿足不同規模企業的部署需求,平臺提供兩種架構方案。一體化部署模式以OceanStor A800存儲系統為底座,集成全部AI能力模塊,在保證高性能的同時支持橫向擴展;分離式部署則采用“數據引擎節點+OceanStor Dorado”架構,允許企業在現有存儲系統上疊加AI引擎,實現業務平滑遷移的同時保護既有投資。











