在人工智能從“基礎(chǔ)模型構(gòu)建”向“規(guī)模化應(yīng)用落地”轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn),云天勵飛近日舉辦“大算力芯片戰(zhàn)略前瞻會”,正式公布未來三年大算力AI推理芯片的戰(zhàn)略布局。公司宣布將集中核心研發(fā)資源突破大模型落地的“成本壁壘”,通過底層架構(gòu)創(chuàng)新實(shí)現(xiàn)百萬Tokens推理成本降低超100倍的目標(biāo),推動AI技術(shù)從實(shí)驗(yàn)室走向普惠化生產(chǎn)場景。
全球算力產(chǎn)業(yè)重心正加速向推理側(cè)傾斜。谷歌2025年4月發(fā)布的第七代TPU“Ironwood”明確定位為“推理時代基石”,重點(diǎn)優(yōu)化大規(guī)模推理能效;英偉達(dá)同年12月斥資200億美元與推理芯片廠商Groq達(dá)成非獨(dú)占許可協(xié)議,吸納其核心團(tuán)隊(duì)強(qiáng)化實(shí)時工作負(fù)載能力。行業(yè)信號顯示,推理競爭已從“參數(shù)規(guī)模”轉(zhuǎn)向“單位成本與交付效率”,能效比成為規(guī)模化落地的核心門檻。
云天勵飛提出GPNPU技術(shù)路線,以“GPNPU = GPGPU + NPU + 3D堆疊存儲”公式重構(gòu)芯片架構(gòu)。該路線通過兼容CUDA生態(tài)實(shí)現(xiàn)一行代碼遷移,降低企業(yè)應(yīng)用門檻;采用NPU專用化設(shè)計(jì)提升能效比,針對大模型推理的結(jié)構(gòu)化負(fù)載優(yōu)化成本;研發(fā)3D堆疊存儲技術(shù)突破“內(nèi)存墻”瓶頸,降低推理時延。公司CTO李愛軍強(qiáng)調(diào),架構(gòu)創(chuàng)新需兼顧通用性與專用性,在工程層面解決可遷移、可部署、可持續(xù)降本三大難題。
在產(chǎn)品化路徑上,云天勵飛推出“算力積木”架構(gòu),通過Chiplet技術(shù)實(shí)現(xiàn)算力模塊化擴(kuò)展,支持從邊緣設(shè)備到千卡集群的彈性部署。公司拒絕單純堆砌芯片參數(shù),轉(zhuǎn)而圍繞真實(shí)業(yè)務(wù)負(fù)載進(jìn)行系統(tǒng)級優(yōu)化,逐項(xiàng)擊穿推理鏈路中的成本與時延瓶頸。目前,其政企事業(yè)部已啟動區(qū)域級“千卡集群”建設(shè),旨在樹立城市AI算力賦能標(biāo)桿。
支撐戰(zhàn)略落地的核心在于五大要素協(xié)同:技術(shù)層面,公司聚焦AI大算力推理芯片研發(fā);產(chǎn)能層面,其國產(chǎn)供應(yīng)鏈儲備為大規(guī)模量產(chǎn)提供確定性;生態(tài)層面,四大事業(yè)部覆蓋研發(fā)、優(yōu)化到推廣的全鏈條;市場層面,政企事業(yè)部主導(dǎo)推理設(shè)備與智算中心建設(shè);資本層面,市值突破萬億元的愿景彰顯長期信心。董事長陳寧特別指出,供應(yīng)鏈安全是當(dāng)前行業(yè)競爭的關(guān)鍵變量,云天勵飛已構(gòu)建起抵御外部風(fēng)險(xiǎn)的護(hù)城河。
根據(jù)規(guī)劃,云天勵飛未來三年將梯度推進(jìn)DeepVerse芯片研發(fā),對標(biāo)國際主流平臺優(yōu)化長上下文預(yù)填充、低時延解碼等關(guān)鍵環(huán)節(jié)。2028年產(chǎn)品將采用PD分離、AFN分離及超節(jié)點(diǎn)架構(gòu)設(shè)計(jì),性能指標(biāo)有望比肩英偉達(dá)Rubin架構(gòu)。公司強(qiáng)調(diào),推理時代的競爭本質(zhì)是“單位推理成本”之爭,唯有將技術(shù)做得足夠便宜、穩(wěn)定、易用,才能推動AI從“能力展示”轉(zhuǎn)向“生產(chǎn)力工具”。











