云天勵(lì)飛近日召開(kāi)“大算力芯片戰(zhàn)略前瞻會(huì)”,正式公布未來(lái)三年在AI推理芯片領(lǐng)域的戰(zhàn)略布局。公司提出“訓(xùn)練追趕、推理超車(chē)”的發(fā)展路徑,計(jì)劃通過(guò)技術(shù)突破降低大模型推理成本,推動(dòng)AI技術(shù)從實(shí)驗(yàn)室走向規(guī)模化應(yīng)用場(chǎng)景。
董事長(zhǎng)兼CEO陳寧在會(huì)上指出,訓(xùn)練芯片與推理芯片在技術(shù)需求上存在本質(zhì)差異。訓(xùn)練芯片追求算力規(guī)模與計(jì)算精度,而推理芯片的核心競(jìng)爭(zhēng)力在于成本控制與效率優(yōu)化。他透露,公司正以“百萬(wàn)Tokens一分錢(qián)”為目標(biāo)研發(fā)下一代芯片,未來(lái)三年內(nèi)將成本進(jìn)一步壓縮至“百萬(wàn)Tokens 0.1分錢(qián)”,為AI商業(yè)化落地創(chuàng)造條件。
針對(duì)中國(guó)芯片產(chǎn)業(yè)發(fā)展,陳寧提出差異化策略:在訓(xùn)練芯片領(lǐng)域持續(xù)追趕國(guó)際先進(jìn)水平,在推理芯片領(lǐng)域依托國(guó)內(nèi)應(yīng)用場(chǎng)景優(yōu)勢(shì)實(shí)現(xiàn)彎道超車(chē)。他強(qiáng)調(diào),中國(guó)豐富的產(chǎn)業(yè)需求、強(qiáng)大的基礎(chǔ)設(shè)施以及開(kāi)源模型生態(tài),為推理芯片創(chuàng)新提供了獨(dú)特機(jī)遇。
CTO李愛(ài)軍詳細(xì)介紹了技術(shù)實(shí)現(xiàn)路徑。公司基于“PD分離”架構(gòu)規(guī)劃了三代芯片產(chǎn)品:首年推出面向計(jì)算密集型任務(wù)的P芯片,對(duì)標(biāo)Hopper架構(gòu);次年研發(fā)面向訪存密集型任務(wù)的D芯片,對(duì)標(biāo)Blackwell架構(gòu);2028年發(fā)布第二代D芯片,實(shí)現(xiàn)毫秒級(jí)推理時(shí)延,算力比肩下一代Rubin架構(gòu)。這種異構(gòu)設(shè)計(jì)通過(guò)超節(jié)點(diǎn)組合滿足大模型集群化部署需求。
支撐該路線圖的核心是云天勵(lì)飛自主研發(fā)的GPNPU架構(gòu)。該架構(gòu)包含四大創(chuàng)新:通過(guò)CUDA兼容提升易用性,降低模型遷移成本;優(yōu)化NPU內(nèi)核能效比,提升推理性價(jià)比;引入3D Memory結(jié)構(gòu)降低訪問(wèn)時(shí)延;采用“算力積木”架構(gòu)實(shí)現(xiàn)超節(jié)點(diǎn)擴(kuò)展,支持萬(wàn)億級(jí)參數(shù)模型推理。這些技術(shù)突破將助力單位推理成本降低兩個(gè)數(shù)量級(jí)以上。
公司高級(jí)副總裁鄧浩然補(bǔ)充介紹了資源保障措施。在資本層面,公司將通過(guò)戰(zhàn)略融資與產(chǎn)業(yè)合作確保研發(fā)持續(xù)投入;在人才方面,已組建跨學(xué)科團(tuán)隊(duì)覆蓋芯片架構(gòu)、算法優(yōu)化與系統(tǒng)集成;產(chǎn)能規(guī)劃上,與國(guó)內(nèi)先進(jìn)制程代工廠建立深度合作,保障芯片量產(chǎn)穩(wěn)定性。
業(yè)內(nèi)分析認(rèn)為,云天勵(lì)飛的戰(zhàn)略抓住了AI規(guī)模化應(yīng)用的關(guān)鍵痛點(diǎn)。當(dāng)前大模型部署成本高企,制約了技術(shù)在醫(yī)療、教育、制造等領(lǐng)域的滲透。通過(guò)架構(gòu)創(chuàng)新與生態(tài)兼容降低推理門(mén)檻,有望加速AI技術(shù)向傳統(tǒng)產(chǎn)業(yè)賦能,推動(dòng)智能化轉(zhuǎn)型進(jìn)入新階段。











