在巴塞羅那舉行的MWC 2026世界移動通信大會上,華為數據存儲產品線總裁袁遠在產品與解決方案發布會上宣布,正式推出面向人工智能領域的創新數據平臺。該平臺針對當前AI應用中普遍存在的推理效率低、記憶管理弱等痛點,通過系統性技術創新為行業提供解決方案。
當前AI技術發展面臨結構性矛盾:行業過度聚焦模型訓練環節,而忽視了對推理環節的深度優化。數據顯示,超過70%的運營商核心業務尚未實現AI深度賦能,主要受制于推理過程中存在的三大瓶頸:知識檢索精度不足導致"幻覺"問題頻發、歷史數據處理效率低下影響響應速度、上下文記憶缺失制約模型持續進化能力。華為此次推出的"3+1"架構數據平臺,正是針對這些核心問題設計的系統性解決方案。
該平臺通過三大核心存儲模塊與統一管理技術的協同創新,構建起完整的推理優化體系。知識庫模塊采用多模態無損解析技術,可將文本、圖像、視頻等異構數據轉化為細粒度知識單元,配合多維檢索算法實現95%以上的檢索準確率。在智能客服場景測試中,系統能精準識別用戶問題中的關鍵要素,快速匹配相關知識片段。
針對推理效率問題,平臺創新的PB級KV Cache存儲技術突破傳統上下文窗口限制。通過歷史數據復用機制,單輪對話處理能力提升3倍,多輪對話場景下首Token生成時延降低90%。某運營商試點顯示,采用該技術后AI客服的并發處理能力從每秒500次提升至2000次,用戶等待時間縮短至0.3秒以內。
記憶庫模塊則構建了動態知識進化機制。通過智能萃取歷史交互數據中的有效信息,形成可追溯的記憶單元。在商業分析場景中,系統能自動識別數據關聯模式,將重復出現的問題解決方案沉淀為結構化知識。測試數據顯示,經過3個月持續學習,模型對復雜業務場景的推理準確率提升42%,展現出顯著的自我優化能力。
平臺配套的UCM(Unified Context Management)技術通過三層緩存架構實現資源智能調度。該技術可根據業務負載動態分配計算資源,在保證推理實時性的同時降低能耗。實測表明,在同等硬件配置下,系統整體推理吞吐量提升2.8倍,資源利用率提高65%。
為滿足不同場景需求,華為提供兩種部署方案:一體化方案基于OceanStor A800存儲系統,集成全部功能模塊,適合新建AI基礎設施的客戶;分離式方案采用"數據引擎節點+OceanStor Dorado"架構,支持在現有存儲系統上疊加AI能力,保護客戶歷史投資。兩種方案均支持彈性擴展,單集群最大可管理EB級數據。











