一家名為Taalas的加拿大芯片初創(chuàng)公司,憑借其宣稱顛覆英偉達(dá)的技術(shù)路線,在人工智能領(lǐng)域引發(fā)了廣泛關(guān)注。這家成立于2023年的公司,于近期推出了首款專為AI推理優(yōu)化的芯片HC1,聲稱在特定場景下性能遠(yuǎn)超傳統(tǒng)GPU方案,甚至可能重塑AI芯片市場格局。
HC1芯片的核心突破在于其“模型即芯片”的設(shè)計(jì)理念。與傳統(tǒng)ASIC(專用集成電路)仍需通過軟件編譯將模型轉(zhuǎn)化為芯片指令不同,Taalas直接將特定大模型“刻”入芯片硬件,通過EDA(電子設(shè)計(jì)自動(dòng)化)流程將模型轉(zhuǎn)化為定制電路。這種設(shè)計(jì)使得數(shù)據(jù)無需在內(nèi)存和計(jì)算單元間頻繁移動(dòng),理論上可消除“內(nèi)存墻”瓶頸,顯著提升推理速度并降低功耗。據(jù)公司披露,采用30芯片集群時(shí),HC1在運(yùn)行meta開源大模型Llama 3.1 8B時(shí),推理速度可達(dá)每秒12000 tokens,能效較傳統(tǒng)GPU方案提升50倍,峰值速度更接近17000 tokens/秒,構(gòu)建成本和功耗分別降至傳統(tǒng)方案的1/20和1/10。
Taalas的技術(shù)路線與其創(chuàng)始人柳比沙·巴伊奇(Ljubi?a Baji?)的背景密切相關(guān)。這位曾在AMD擔(dān)任架構(gòu)師的業(yè)界資深人士,此前創(chuàng)立了AI芯片獨(dú)角獸Tenstorrent,并主導(dǎo)過開源RISC-V架構(gòu)的軟硬件協(xié)同設(shè)計(jì)。2022年后,巴伊奇聯(lián)合妻子萊拉·巴伊奇(前AMD系統(tǒng)工程高級(jí)經(jīng)理)及ASIC設(shè)計(jì)專家德拉貢·伊格納托維奇(Drago Ignjatovic),組建了Taalas的核心團(tuán)隊(duì),成員多來自AMD、蘋果、谷歌等科技巨頭。公司成立僅一年便完成5000萬美元首輪融資,截至目前已累計(jì)融資超2億美元,資本市場的青睞為其技術(shù)探索提供了充足彈藥。
HC1的商業(yè)化路徑清晰而激進(jìn):客戶提交模型后,Taalas在一周內(nèi)完成電路設(shè)計(jì),再通過臺(tái)積電代工在兩個(gè)月內(nèi)交付定制芯片。這種“模型-芯片”強(qiáng)綁定的模式,在測試中展現(xiàn)出驚人性能。公司宣稱,HC1在Llama 3.1 8B上的推理速度是英偉達(dá)H200的48倍、B200的34倍,甚至超越了估值230億美元的ASIC明星企業(yè)Cerebras的同類產(chǎn)品。實(shí)測演示中,大模型對用戶問題的響應(yīng)速度達(dá)到“秒回”級(jí)別,引發(fā)業(yè)界對AI交互體驗(yàn)變革的想象。
然而,HC1的“極致優(yōu)化”也伴隨顯著爭議。質(zhì)疑者指出,其測試數(shù)據(jù)可能基于特定場景的優(yōu)化,實(shí)際通用性存疑。有芯片愛好者分析,HC1或通過預(yù)置答案實(shí)現(xiàn)“速度秒殺”,但面對動(dòng)態(tài)問題時(shí)可能表現(xiàn)不佳。更關(guān)鍵的是,大模型迭代速度遠(yuǎn)超芯片交付周期——當(dāng)前頂尖模型的優(yōu)勢窗口僅月余,而Taalas的定制芯片需至少兩個(gè)月生產(chǎn),可能導(dǎo)致“芯片未量產(chǎn),模型已過時(shí)”的困境。HC1的“只讀”模式限制了模型更新能力,若底層大模型架構(gòu)發(fā)生變革,現(xiàn)有芯片可能面臨徹底淘汰的風(fēng)險(xiǎn)。
盡管如此,Taalas的技術(shù)方向仍獲得部分專家認(rèn)可。中國科學(xué)院計(jì)算技術(shù)研究所副研究員趙永威認(rèn)為,其“硬連線”模式代表未來芯片發(fā)展趨勢,盡管當(dāng)前應(yīng)用價(jià)值有限,但為后續(xù)研究提供了重要參考。科技記者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)則指出,Taalas的芯片更新成本相對模型訓(xùn)練成本微不足道,若主要模型發(fā)布間隔延長,其技術(shù)或迎來更廣闊市場。低延遲、低功耗的特性也使其在邊緣計(jì)算場景(如機(jī)器人、自動(dòng)駕駛、高端手機(jī))中具備潛力,這些領(lǐng)域?qū)Χㄖ苹P偷男枨笈cHC1的設(shè)計(jì)理念高度契合。
面對爭議,Taalas已規(guī)劃技術(shù)迭代路線。公司宣布將于今年冬季推出第二代HC2芯片,承諾進(jìn)一步提升執(zhí)行速度和性能。同時(shí),巴伊奇透露正在開發(fā)適用于中等規(guī)模推理模型的產(chǎn)品,試圖拓展技術(shù)適用范圍。然而,要真正挑戰(zhàn)英偉達(dá)的霸主地位,Taalas不僅需證明其技術(shù)在大規(guī)模模型中的可行性,還需構(gòu)建類似CUDA的開發(fā)者生態(tài)——這或許是比芯片性能更艱巨的長期挑戰(zhàn)。







