在近期舉辦的華為云中小企業(yè)AI解決方案發(fā)布會上,一項名為柔性智算操作系統(tǒng)FlexNPU的算力創(chuàng)新技術成為焦點。這項技術通過優(yōu)化AI算力調度,有效控制了企業(yè)在智能體應用中的Token消耗成本,為中小企業(yè)擁抱Agentic時代提供了高性價比的算力支持,突破了長期制約企業(yè)級智能體普及的算力瓶頸。
華為云中國區(qū)銷售伙伴發(fā)展部部長在致辭中指出,到2026年,華為云將構建更適配中小企業(yè)需求的AI算力生態(tài),通過柔性化算力服務解決企業(yè)"用不起、用不好"的核心痛點。這一戰(zhàn)略轉變將推動算力資源配置從粗放式管理向精細化運營升級,幫助企業(yè)在智能化轉型中實現成本可控與效率提升的雙重目標。
當前企業(yè)AI應用呈現冰火兩重天的態(tài)勢。華為云SMB解決方案負責人用"一半是海水,一半是火焰"形容轉型現狀:一方面,以OpenClaw為代表的新型生產力工具不斷涌現;另一方面,高昂的算力成本、復雜的技術門檻以及場景適配難題,成為橫亙在中小企業(yè)面前的三座大山。據統(tǒng)計,現有AI硬件算力池的平均利用率不足30%,大量算力資源處于閑置狀態(tài)。
針對這些挑戰(zhàn),華為云推出的中小企業(yè)AI解決方案構建了四層架構體系:在基礎設施層提供昇騰多代產品與自研AI Infra OS;模型服務層支持主流開源模型并支持企業(yè)定制化微調;智能體平臺層打造易用開發(fā)環(huán)境;應用層則聯(lián)合生態(tài)伙伴覆蓋營銷、辦公、運維等高頻場景。該方案已成功服務2600余家企業(yè),解決500多個行業(yè)場景問題。
FlexNPU技術的突破性在于其賦予算力"液態(tài)化"特性。華為云首席架構師形象地將之比作"如意金箍棒",該技術通過動態(tài)混部、顆粒度復用等創(chuàng)新,使NPU/GPU算力能夠根據業(yè)務需求實時伸縮。在大模型推理場景下,通過PD動態(tài)混部技術將Token性價比提升40%以上;小模型推理則通過1%卡級粒度的時分復用,使算力成本降低2-3倍;故障恢復機制確保推理會話中斷點續(xù)推,減少重計算開銷。
實際應用案例印證了技術價值。某制造企業(yè)基于昇騰平臺打造的智能體解決方案,實現合同審核準確率90%、效率提升300%,生產數據查詢時間從1小時壓縮至2分鐘。在零售物流領域,智能路徑規(guī)劃系統(tǒng)使排線效率提升60倍,減少20%冗余出車,降低物流成本5.8%。這些成果顯示,AI技術正在從概念驗證走向規(guī)模化商用。
華為云強調,在AI技術演進中,算力基礎設施、模型開發(fā)工具與行業(yè)應用需形成協(xié)同創(chuàng)新。通過發(fā)布"加速智能化企業(yè)快成長行動",華為云將聯(lián)合生態(tài)伙伴在品牌、技術、商業(yè)等維度提供全方位支持,構建開放共贏的AI創(chuàng)新生態(tài),助力中小企業(yè)在智能化浪潮中搶占先機。











