由前谷歌技術(shù)團(tuán)隊(duì)成員創(chuàng)立的芯片企業(yè)MatX Inc.近日宣布完成5億美元B輪融資,資金將用于加速其首款人工智能專用處理器的研發(fā)與量產(chǎn)。本輪融資由量化交易巨頭Jane Street與科技投資機(jī)構(gòu)Situational Awareness聯(lián)合領(lǐng)投,芯片制造商Marvell Technology、支付平臺(tái)Stripe聯(lián)合創(chuàng)始人及另外四家戰(zhàn)略投資者參與跟投。此前該公司已通過(guò)多輪融資從相同投資方組成的財(cái)團(tuán)獲得超1億美元支持。
MatX One作為其核心產(chǎn)品,采用突破性的"可分割脈動(dòng)陣列"架構(gòu)設(shè)計(jì)。這種創(chuàng)新架構(gòu)允許單個(gè)芯片將計(jì)算陣列動(dòng)態(tài)劃分為多個(gè)獨(dú)立模塊,每個(gè)模塊可針對(duì)特定數(shù)據(jù)類型優(yōu)化電路配置。相較于傳統(tǒng)脈動(dòng)陣列固定化的計(jì)算模式,該技術(shù)使芯片在處理不同規(guī)模的語(yǔ)言模型時(shí)能自動(dòng)調(diào)整計(jì)算路徑,顯著提升資源利用率。
在存儲(chǔ)架構(gòu)方面,MatX One采用混合內(nèi)存方案:將占模型參數(shù)90%以上的權(quán)重?cái)?shù)據(jù)存儲(chǔ)在片上SRAM中,這種緊鄰計(jì)算核心的高速內(nèi)存使數(shù)據(jù)訪問(wèn)延遲降低至納秒級(jí);而用于存儲(chǔ)中間計(jì)算結(jié)果的KV緩存則采用高帶寬內(nèi)存(HBM),在保證處理速度的同時(shí)支持更長(zhǎng)的上下文窗口。這種設(shè)計(jì)使芯片在保持低延遲優(yōu)勢(shì)的同時(shí),突破了傳統(tǒng)SRAM容量限制。
技術(shù)團(tuán)隊(duì)在解碼機(jī)制上實(shí)現(xiàn)雙重優(yōu)化:通過(guò)集成推測(cè)解碼技術(shù),處理器可并行生成多個(gè)候選輸出序列,結(jié)合塊級(jí)稀疏注意力機(jī)制對(duì)非關(guān)鍵計(jì)算進(jìn)行智能跳過(guò)。實(shí)驗(yàn)室測(cè)試數(shù)據(jù)顯示,在處理千億參數(shù)級(jí)模型時(shí),MatX One的吞吐量較主流GPU提升3.8倍,而能耗降低42%。公司首席架構(gòu)師在技術(shù)白皮書(shū)中透露,其數(shù)值計(jì)算單元采用全新浮點(diǎn)精度算法,在保證模型精度的前提下減少了30%的運(yùn)算量。
本輪融資將重點(diǎn)投入芯片流片前的最后驗(yàn)證階段。MatX計(jì)劃在未來(lái)12個(gè)月內(nèi)完成7nm制程工藝的工程樣片制造,隨后啟動(dòng)與超算中心的聯(lián)合測(cè)試。值得關(guān)注的是,Marvell Technology除資金支持外,還將開(kāi)放其先進(jìn)封裝測(cè)試線供MatX使用,這為芯片的量產(chǎn)良率控制提供重要保障。
行業(yè)分析師指出,隨著大語(yǔ)言模型參數(shù)規(guī)模突破萬(wàn)億級(jí),現(xiàn)有計(jì)算架構(gòu)面臨內(nèi)存帶寬瓶頸和能效比危機(jī)。MatX的混合內(nèi)存架構(gòu)與動(dòng)態(tài)陣列分割技術(shù),為解決"內(nèi)存墻"問(wèn)題提供了新思路。據(jù)供應(yīng)鏈消息,多家云服務(wù)提供商已就芯片采購(gòu)展開(kāi)前期洽談,首批訂單容量可能超過(guò)50萬(wàn)片。
在生態(tài)建設(shè)方面,MatX宣布將開(kāi)源其編譯器工具鏈,支持TensorFlow、PyTorch等主流框架的無(wú)縫遷移。公司CTO在技術(shù)研討會(huì)上演示了用單顆MatX One芯片實(shí)時(shí)處理1750億參數(shù)模型的場(chǎng)景,其每秒32000 tokens的生成速度創(chuàng)下行業(yè)新紀(jì)錄。這項(xiàng)突破可能重塑云計(jì)算市場(chǎng)的定價(jià)模式——按輸出token計(jì)費(fèi)的服務(wù)或?qū)⒁蛴布侍嵘蠓祪r(jià)。










