在華為中國(guó)合作伙伴大會(huì)期間,一場(chǎng)聚焦人工智能前沿發(fā)展的盛會(huì)——昇騰人工智能伙伴峰會(huì)在深圳成功舉辦。本次峰會(huì)以“與時(shí)代 共昇騰”為主題,吸引了眾多行業(yè)專(zhuān)家、企業(yè)代表齊聚一堂,共同探討人工智能在行業(yè)智能化進(jìn)程中的新趨勢(shì)與新機(jī)遇。華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊在會(huì)上發(fā)表了主題為《一起昇騰,共贏行業(yè)智能化》的精彩演講,深入剖析了人工智能的發(fā)展態(tài)勢(shì),并分享了昇騰在推動(dòng)行業(yè)智能化方面的戰(zhàn)略布局與實(shí)踐成果。
張迪煊指出,2025 年是昇騰在技術(shù)沉淀、擁抱開(kāi)源、把握機(jī)遇方面取得重要進(jìn)展的一年。去年 8 月,華為在北京正式宣布 CANN 和 Mind 系列軟件全面開(kāi)源開(kāi)放,實(shí)現(xiàn)架構(gòu)解耦,并積極與業(yè)界共創(chuàng),貢獻(xiàn)關(guān)鍵特性。例如,聯(lián)合科大訊飛落地大 EP 技術(shù),并于 9 月將其貢獻(xiàn)到 vLLM 社區(qū),填補(bǔ)了業(yè)界多機(jī)推理加速能力的空白,激發(fā)了眾多伙伴和開(kāi)發(fā)者的創(chuàng)新熱情。截至目前,昇騰已向三方社區(qū)累計(jì)貢獻(xiàn)超過(guò) 11 萬(wàn)行代碼,有力推動(dòng)了技術(shù)的共享與創(chuàng)新加速。
在生態(tài)兼容方面,昇騰始終與主流生態(tài)保持緊密同頻。通過(guò)識(shí)別并快速響應(yīng)開(kāi)發(fā)者需求,在畢昇編譯器層構(gòu)建 AscendNPU IR,實(shí)現(xiàn)與 Triton 的平滑對(duì)接,讓開(kāi)發(fā)者能夠保持原有的使用習(xí)慣。同時(shí),昇騰兼容了 FSDP2、verl、vLLM、xLLM 等 50 多個(gè)主流開(kāi)源社區(qū)和項(xiàng)目,支持所有訓(xùn)練和推理創(chuàng)新基于昇騰快速落地。對(duì)開(kāi)源模型的 0day 支持,使開(kāi)發(fā)者能第一時(shí)間獲取業(yè)界最新的模型能力,越來(lái)越多的 SOTA 開(kāi)源模型也基于昇騰原生孵化。以智譜為例,其基于昇騰僅用三個(gè)月就完成了多模態(tài)大模型 GLM - Image 的訓(xùn)練,該模型采用自回歸 + 擴(kuò)散的混合架構(gòu),開(kāi)源不到 24 小時(shí)便登頂 Hugging Face Trending 榜第一,充分證明了在昇騰上能夠訓(xùn)練出世界級(jí)領(lǐng)先的大模型。
面對(duì)市場(chǎng)的快速變化,昇騰展現(xiàn)出強(qiáng)大的響應(yīng)能力。去年 DeepSeek 發(fā)布后,春節(jié)期間華為迅速在上海練秋湖集結(jié) 500 多人進(jìn)行攻關(guān)會(huì)戰(zhàn),不到一周就發(fā)布了大模型應(yīng)用一體機(jī)參考配置,助力 80 多家伙伴在 2 周內(nèi)推出自己的一體機(jī)產(chǎn)品,迅速搶占市場(chǎng)。一年來(lái),已有 350 多家伙伴打造了 400 多款深入業(yè)務(wù)場(chǎng)景的一體機(jī)產(chǎn)品,服務(wù)了 2700 多家客戶(hù),占據(jù)國(guó)內(nèi)一體機(jī)市場(chǎng) 80%以上的份額,涌現(xiàn)出一大批能力型伙伴,加速了大模型在各行各業(yè)的落地。
回顧過(guò)去三年,AI 實(shí)現(xiàn)了快速發(fā)展。2023 年作為“大模型元年”,推動(dòng)模型從感知理解邁向生成創(chuàng)造;2024 年迎來(lái)“大模型推理元年”,Tokens 成為 AI 時(shí)代的新量綱;2025 年,中國(guó)大模型積極開(kāi)源,憑借出色性能成為應(yīng)用首選,Tokens 使用量呈爆發(fā)式增長(zhǎng)。如今,我們已正式邁入 Agentic AI 時(shí)代,這是 AI 產(chǎn)業(yè)發(fā)展的全新拐點(diǎn),標(biāo)志著 AI 從“會(huì)聊天”向“能辦事”升級(jí)。在 To C 場(chǎng)景,OpenClaw 成為現(xiàn)象級(jí)應(yīng)用,短時(shí)間內(nèi)獲得大量用戶(hù)和關(guān)注;國(guó)內(nèi)頭部互聯(lián)網(wǎng)企業(yè)爭(zhēng)相布局智能體入口,企業(yè)和個(gè)人積極參與打造專(zhuān)屬個(gè)人智能助理。在 To B 場(chǎng)景,AI 深度滲透生產(chǎn)、決策等環(huán)節(jié),基座模型落地行業(yè)核心場(chǎng)景需要行業(yè)專(zhuān)業(yè)知識(shí),強(qiáng)化學(xué)習(xí)成為必選之路,而海量 Tokens 成為支撐這一切的核心,其計(jì)算效率直接決定企業(yè)核心收益。
為滿(mǎn)足不同場(chǎng)景的需求,昇騰開(kāi)放大中小系列化算力。在大算力場(chǎng)景,主要滿(mǎn)足大模型預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)后訓(xùn)練以及大規(guī)模推理服務(wù)需求。昇騰將持續(xù)深耕技術(shù)研發(fā),打造領(lǐng)先的超節(jié)點(diǎn)架構(gòu)及產(chǎn)品,開(kāi)放靈衢協(xié)議、部件及參考架構(gòu),助力伙伴打造超節(jié)點(diǎn)系統(tǒng),重塑企業(yè)核心業(yè)務(wù)。在中算力場(chǎng)景,覆蓋輔助醫(yī)療、智慧教學(xué)等主流行業(yè)應(yīng)用場(chǎng)景,昇騰圍繞“開(kāi)箱即用”,兼顧“快速部署”與“成本可控”,開(kāi)放中心模組/刀片,伙伴可結(jié)合模型及軟件生態(tài)打造大模型應(yīng)用一體機(jī)、高密服務(wù)器等產(chǎn)品,加速行業(yè)智能化升級(jí)。在小算力場(chǎng)景,聚焦工業(yè)質(zhì)檢、具身智能、科研教學(xué)等智能邊端領(lǐng)域,昇騰開(kāi)放標(biāo)準(zhǔn)模組和板卡,使能伙伴打造多樣化邊緣算力設(shè)備,滿(mǎn)足差異化市場(chǎng)需求,挖掘潛力巨大的海量市場(chǎng)。
針對(duì)大規(guī)模推理服務(wù)場(chǎng)景,AI Agent 成為企業(yè)智能化必備工具,其多輪自我迭代帶來(lái)百倍級(jí) Tokens 需求和 10ms 級(jí)時(shí)延要求。傳統(tǒng)服務(wù)器堆疊方式存在局限,昇騰 384 超節(jié)點(diǎn)可實(shí)現(xiàn) 48TB 內(nèi)存統(tǒng)一編址,全局內(nèi)存共享,共享內(nèi)存容量較傳統(tǒng)方式提升 96 倍,數(shù)據(jù)交互效率提升三倍,能滿(mǎn)足 Agent 超長(zhǎng)上下文需求,推理 Decode 吞吐倍級(jí)提升,是大規(guī)模推理的必選方案。同時(shí),昇騰為伙伴提供三種靈活高效的實(shí)現(xiàn)路徑,助力構(gòu)建更佳推理方案。目前,硅基流動(dòng)、清昴智能等能力型伙伴已基于昇騰構(gòu)建推理引擎,為金融等客戶(hù)提供大規(guī)模推理服務(wù),顯著提升多輪任務(wù)應(yīng)答速度。
在強(qiáng)化學(xué)習(xí)后訓(xùn)練場(chǎng)景,昇騰沉淀了一套完整的最佳實(shí)踐。伙伴可選擇最新 RL 模型、算法及框架,通過(guò)完整 Docker 鏡像一鍵完成部署。針對(duì)業(yè)界普遍關(guān)注的訓(xùn)推資源合理調(diào)度、傳輸效率提升和訓(xùn)推一致問(wèn)題,昇騰創(chuàng)新推出“異步流式數(shù)據(jù)引擎 TQ”技術(shù),通過(guò)解耦控制流與數(shù)據(jù)流,實(shí)現(xiàn)樣本數(shù)據(jù)直接在推理節(jié)點(diǎn)和訓(xùn)練節(jié)點(diǎn)間交互,依托超節(jié)點(diǎn)內(nèi)存統(tǒng)一編址,端到端性能提升 40%以上。該特性已合入 verl 社區(qū),并成功應(yīng)用于商業(yè)化廣告、信貸風(fēng)控等核心場(chǎng)景,實(shí)現(xiàn)倍級(jí)性能提升。昇騰將持續(xù)圍繞精度優(yōu)化、訓(xùn)推轉(zhuǎn)換、訓(xùn)練及推理加速,提供業(yè)界最全、最新的 RL 加速特性,并第一時(shí)間貢獻(xiàn)到開(kāi)源社區(qū)。
為支持國(guó)計(jì)民生大模型應(yīng)用場(chǎng)景,昇騰產(chǎn)品實(shí)現(xiàn)全面升級(jí),分級(jí)分檔適配不同模型需求。面向百億級(jí)模型,開(kāi)放 A2 標(biāo)卡,內(nèi)存帶寬達(dá)業(yè)界 1.8 倍,實(shí)現(xiàn) 100ms 推理時(shí)延;面向千億級(jí)模型,提供單機(jī)服務(wù)器,單機(jī)算力是業(yè)界的 2.3 倍;面向萬(wàn)億級(jí)模型,提供雙機(jī)超節(jié)點(diǎn)服務(wù)器,是業(yè)界唯一能夠部署 T 級(jí)模型的產(chǎn)品,整機(jī)算力達(dá) 3.78 倍業(yè)界,突破 20ms 低時(shí)延。同時(shí),昇騰推出 Agentic 開(kāi)源參考設(shè)計(jì),將深度適配優(yōu)化后的推理引擎、主流開(kāi)源模型權(quán)重及 OpenClaw 等 Agent AI 框架打包成完整鏡像,伙伴可快速打造 Agent 應(yīng)用一體機(jī)。基于雙機(jī)超節(jié)點(diǎn)服務(wù)器打造的一體機(jī),在不同模型上能提供大量 Tokens,滿(mǎn)足業(yè)務(wù)需求。目前,已有 20 多家伙伴正在落地 Agent 一體機(jī)產(chǎn)品,服務(wù)多個(gè)行業(yè)核心領(lǐng)域。
面向推薦、多模態(tài)、LLM 三大推理場(chǎng)景,昇騰推出 Atlas 350 加速卡。該加速卡搭載全新昇騰 950PR 處理器,性能全面升級(jí),較業(yè)界同類(lèi)產(chǎn)品領(lǐng)先 1 至 1.4 倍。其核心優(yōu)勢(shì)體現(xiàn)在算力、內(nèi)存雙升級(jí),單卡算力和片上內(nèi)存大幅提升,多模態(tài)生成性能顯著提高;訪存更靈活,Cache - line 的訪存粒度降低,提升搜索推薦等場(chǎng)景訪存效率;開(kāi)發(fā)更易用,支持 SIMT + SIMD 混合編程,滿(mǎn)足伙伴多樣化開(kāi)發(fā)需求,助力打造高性能推理方案。
在推動(dòng)行業(yè)應(yīng)用場(chǎng)景解決方案打造方面,2025 年 9 月華為開(kāi)發(fā)者大會(huì)上,昇騰聯(lián)合 20 多家 ISV 啟動(dòng)面向金融、能源等 5 大行業(yè)的方案打造工作。半年來(lái),已成功孵化十余個(gè)應(yīng)用場(chǎng)景方案,落地 180 多家客戶(hù),實(shí)現(xiàn)技術(shù)與業(yè)務(wù)深度融合。例如在智慧文旅場(chǎng)景,昇騰聯(lián)合海天瑞聲、陜文投打造多模態(tài) AI 伴游助手解決方案,具備多種核心能力,依托海天瑞聲技術(shù)積累實(shí)現(xiàn)文旅知識(shí)秒級(jí)獲取。目前,基于該方案打造的 AI 伴游助手“小七”已在陜西各大景點(diǎn)投放使用,為大量游客提供個(gè)性化出游體驗(yàn)。
在智能邊端領(lǐng)域,昇騰開(kāi)放更多算力檔位、更高集成度、更高溫寬設(shè)計(jì)的模組/板卡,結(jié)合更多 OS 兼容、更多場(chǎng)景 SDK,使能伙伴打造多樣化產(chǎn)品,廣泛應(yīng)用于多個(gè)行業(yè)場(chǎng)景。例如,軟通華方、同泰怡等伙伴基于 Atlas 300I A2 打造液冷 AI 工作站,具備多種競(jìng)爭(zhēng)力,成為多個(gè)行業(yè)本地算力設(shè)備首選。
CANN 開(kāi)源開(kāi)放實(shí)現(xiàn)了三大升級(jí)。部署效率方面,原有大包拆分為多個(gè)可獨(dú)立升級(jí)和部署的組件,包大小和特性加載時(shí)間大幅縮減,提升部署效率。開(kāi)發(fā)體驗(yàn)上,去年實(shí)現(xiàn)主流算子編程框架無(wú)感對(duì)接,今年將開(kāi)源 PyPTO 編程范式,強(qiáng)化 Python + Tile 編程能力,減少算子代碼量,借助可視化調(diào)試調(diào)優(yōu)能力縮短復(fù)雜 CV 融合算子開(kāi)發(fā)時(shí)間,同時(shí)提供開(kāi)源 Skill 庫(kù)支持打造算子自動(dòng)生成 Agent。社區(qū)資源方面,完善開(kāi)源社區(qū) CI/CD,提供完整代碼流水線和免費(fèi)算力資源,降低創(chuàng)新門(mén)檻。
昇騰生態(tài)的蓬勃發(fā)展離不開(kāi)伙伴的努力。昇騰持續(xù)圍繞硬件、算子、加速庫(kù)、模型及應(yīng)用五大創(chuàng)新方向,攜手伙伴共同發(fā)展。隨著基礎(chǔ)軟件全面開(kāi)源,將轉(zhuǎn)向社區(qū)化運(yùn)作,為伙伴明確成長(zhǎng)和創(chuàng)新方向,完善激勵(lì)機(jī)制,鼓勵(lì)共享,提供知識(shí)體系和開(kāi)放能力認(rèn)證,加速伙伴能力轉(zhuǎn)型。同時(shí),通過(guò)社區(qū)下發(fā)創(chuàng)新任務(wù),設(shè)立創(chuàng)新激勵(lì)基金,助力伙伴創(chuàng)新發(fā)展。昇騰還深化昇騰萬(wàn)里伙伴計(jì)劃,NRE 全面升級(jí),投入資金鼓勵(lì)伙伴創(chuàng)新,將創(chuàng)新成果和應(yīng)用案例上架社區(qū) AI 應(yīng)用市場(chǎng),與伙伴聯(lián)合推廣、共享收益。








