在近日舉辦的巴塞羅那MWC 2026世界移動通信大會上,華為數據存儲產品線總裁袁遠在產品與解決方案發布會上,正式推出了一款創新的AI數據平臺,引發行業廣泛關注。該平臺旨在突破當前AI應用在運營商核心業務中面臨的瓶頸,通過優化推理環節,提升整體應用效能。
當前,AI技術在運營商領域的應用仍面臨諸多挑戰,尤其是“重訓練、輕推理”的行業傾向,導致許多模型難以深入核心業務。推理作為AI應用落地的關鍵環節,其性能直接影響用戶體驗。為解決這一問題,華為推出了首創的“3+1”AI數據平臺,針對知識、KV Cache和記憶三大核心要素進行存儲與優化,并通過UCM技術實現統一調度與管理,從而顯著提升用戶推理體驗。
在知識庫方面,該平臺通過多模無損解析和Token級編碼技術,將文本、圖片、視頻等資源轉化為細粒度知識,結合多維度檢索與比對,實現了超過95%的檢索準確率。這一特性在智能查詢場景中表現尤為突出,能夠為用戶提供更精準的信息檢索服務。
針對KV Cache的優化,平臺支持PB級歷史數據存儲,在AI客服場景中,不僅大幅擴展了單次對話的上下文窗口,還能在多輪對話中復用歷史KV Cache,避免重復計算。這一創新使得首Token時延降低90%,模型響應速度顯著提升,為用戶帶來更流暢的交互體驗。
記憶庫功能則聚焦于上下文記憶管理,通過精準萃取歷史數據與經驗,形成可召回的記憶庫。在商業數據洞察場景中,這一特性使模型能夠“越用越聰明”,隨著使用時間的增長,推理精度持續提升,實現持續進化。
UCM推理記憶數據管理技術是該平臺的核心調度中樞。通過三層緩存架構,對知識庫、KV Cache和記憶庫進行分級管理與智能調度,進一步優化了推理能力,確保資源的高效利用。
為滿足不同場景的需求,該AI數據平臺提供了一體化和分離式兩大部署模式。一體化部署以OceanStor A800為底座,集成所有核心能力,兼具高性能與靈活擴展性;分離式部署則采用“數據引擎節點 + OceanStor Dorado”架構,支持在現有系統上新增數據引擎節點,保護歷史投資的同時,助力業務平滑轉型。這一設計充分考慮了企業的實際需求,為AI技術的落地提供了更多選擇。











