一款名為HC1的AI推理芯片近日在硅谷引發(fā)廣泛關(guān)注。這款由初創(chuàng)公司Taalas研發(fā)的芯片,憑借每秒17000個(gè)token的峰值推理速度,成為當(dāng)前AI芯片領(lǐng)域的現(xiàn)象級(jí)產(chǎn)品。與傳統(tǒng)方案相比,HC1不僅將推理速度提升10倍,更將成本壓縮至二十分之一,功耗降低至十分之一,為L(zhǎng)LM(大語(yǔ)言模型)的實(shí)時(shí)應(yīng)用開(kāi)辟了新可能。
HC1的核心突破在于其“芯片即模型”的架構(gòu)設(shè)計(jì)。與傳統(tǒng)將模型加載至內(nèi)存的方式不同,Taalas團(tuán)隊(duì)直接將Llama 3.1 8B模型固化在硅片上,通過(guò)掩模ROM技術(shù)實(shí)現(xiàn)模型與硬件的深度融合。這種設(shè)計(jì)雖犧牲了部分靈活性,卻換來(lái)了極致的能效比——單顆芯片典型功耗僅250W,10顆芯片組成的服務(wù)器集群總功耗也不過(guò)2.5kW,可直接采用常規(guī)空氣冷卻方案部署。
性能對(duì)比數(shù)據(jù)凸顯了HC1的顛覆性。在相同模型測(cè)試中,Cerebras的推理速度為2000 token/s,SambaNova約為900 token/s,Groq為600 token/s,而英偉達(dá)Blackwell架構(gòu)的B200僅350 token/s。HC1的17000 token/s表現(xiàn),相當(dāng)于將行業(yè)標(biāo)桿性能提升了數(shù)個(gè)數(shù)量級(jí)。這種優(yōu)勢(shì)源于其結(jié)構(gòu)化ASIC設(shè)計(jì)理念:通過(guò)固定底層電路、僅調(diào)整兩層掩模的方式,將芯片開(kāi)發(fā)周期從傳統(tǒng)6個(gè)月縮短至2個(gè)月,同時(shí)保持設(shè)計(jì)成本可控。
技術(shù)實(shí)現(xiàn)層面,HC1采用臺(tái)積電N6工藝,芯片面積815mm2,支持開(kāi)源生態(tài)。其創(chuàng)新性的存儲(chǔ)架構(gòu)包含可編程SRAM區(qū)域,用于保存微調(diào)權(quán)重(如LoRA)和KV緩存,而模型主體則通過(guò)掩模ROM固化執(zhí)行。為彌補(bǔ)量化帶來(lái)的精度損失,研究團(tuán)隊(duì)開(kāi)發(fā)了LaRA適配器進(jìn)行重新訓(xùn)練,并配置可調(diào)上下文窗口,在靈活性與性能間取得平衡。這種“硬連線”設(shè)計(jì)雖面臨模型迭代風(fēng)險(xiǎn),卻為特定場(chǎng)景提供了前所未有的效率優(yōu)勢(shì)。
Taalas的野心不止于單芯片突破。針對(duì)DeepSeekR1-671B等超大模型,團(tuán)隊(duì)提出了多芯片協(xié)同方案:將SRAM部分拆分至獨(dú)立芯片,使單片HC1的存儲(chǔ)密度提升至約20位參數(shù)。30顆定制芯片組成的集群可實(shí)現(xiàn)每用戶每秒12000 token的處理速度,且成本不到同等GPU方案的50%。即使考慮HC1每年更新的假設(shè),其四年總成本仍優(yōu)于GPU的四年更新周期。
這家成立僅兩年的公司,擁有堪稱(chēng)“AMD夢(mèng)之隊(duì)”的創(chuàng)始陣容。聯(lián)合創(chuàng)始人Ljubi?a Baji?曾任AMD集成電路設(shè)計(jì)總監(jiān),主導(dǎo)過(guò)高性能GPU研發(fā);Leila Baji?擁有AMD、ATI、Altera的跨平臺(tái)技術(shù)管理經(jīng)驗(yàn);Drago Ignjatovi?則是AMD前ASIC設(shè)計(jì)總監(jiān)。三位技術(shù)領(lǐng)袖的深厚積淀,使Taalas在創(chuàng)立初期即獲得2億美元融資,目前團(tuán)隊(duì)規(guī)模僅24人,產(chǎn)品研發(fā)投入僅3000萬(wàn)美元。
市場(chǎng)對(duì)HC1的評(píng)價(jià)呈現(xiàn)兩極分化。支持者認(rèn)為其亞毫秒級(jí)延遲將推動(dòng)具身智能、實(shí)時(shí)交互等前沿領(lǐng)域發(fā)展;批評(píng)者則指出硬編碼架構(gòu)可能加速芯片過(guò)時(shí),尤其在模型迭代速度日益加快的背景下。這種爭(zhēng)議恰恰反映了AI芯片設(shè)計(jì)的核心矛盾:通用性與專(zhuān)用性的永恒博弈。Taalas的選擇,無(wú)疑為行業(yè)提供了一條激進(jìn)卻值得深思的新路徑。









