據(jù)媒體援引消息人士報(bào)道,芯片巨頭英偉達(dá)計(jì)劃發(fā)布一款全新處理器,專門為人工智能(AI)研究公司OpenAI及其他客戶打造,以幫助他們構(gòu)建更快速、更高效的工具。
知情人士透露,英偉達(dá)正在設(shè)計(jì)一套新的推理計(jì)算系統(tǒng)。這一新平臺(tái)預(yù)計(jì)將在下個(gè)月于圣何塞舉行的英偉達(dá)GTC開(kāi)發(fā)者大會(huì)上發(fā)布,并將整合由初創(chuàng)公司Groq設(shè)計(jì)的芯片。
推理計(jì)算是一種讓AI模型能夠?qū)τ脩籼釂?wèn)作出響應(yīng)的處理方式,該領(lǐng)域已成為行業(yè)激烈競(jìng)爭(zhēng)的焦點(diǎn)。谷歌和亞馬遜等公司已經(jīng)設(shè)計(jì)出與英偉達(dá)旗艦系統(tǒng)相競(jìng)爭(zhēng)的芯片。
而科技行業(yè)中自動(dòng)化編程的迅猛發(fā)展,也催生了對(duì)新型芯片的需求,這些芯片需要更高效地處理復(fù)雜的AI相關(guān)任務(wù)。
知情人士表示,OpenAI已同意成為這款新處理器的最大客戶之一,這對(duì)英偉達(dá)而言是一項(xiàng)重大勝利。
作為英偉達(dá)最大的客戶之一,OpenAI在過(guò)去幾個(gè)月一直在尋求比英偉達(dá)芯片更高效的替代方案,并在上個(gè)月與芯片初創(chuàng)公司Cerebras簽署協(xié)議,為自身提供更多選擇。
英偉達(dá)GPU的潛在挑戰(zhàn)
英偉達(dá)長(zhǎng)期主導(dǎo)著GPU(圖形處理器)市場(chǎng)。據(jù)分析師估計(jì),英偉達(dá)控制著90%以上的GPU市場(chǎng)份額。
GPU是一種能夠同時(shí)執(zhí)行數(shù)十億個(gè)簡(jiǎn)單任務(wù)的處理器。
英偉達(dá)Hopper、Blackwell和Rubin系列GPU被認(rèn)為是訓(xùn)練超大型AI模型的行業(yè)標(biāo)桿產(chǎn)品,價(jià)格也處于高位。
然而,自AI熱潮興起以來(lái),英偉達(dá)首次面臨其旗艦產(chǎn)品的局限性。隨著市場(chǎng)重心從訓(xùn)練轉(zhuǎn)向推理,一些客戶開(kāi)始向英偉達(dá)施壓,要求其推出更高效驅(qū)動(dòng)AI應(yīng)用的芯片。
過(guò)去一年,隨著企業(yè)部署AI代理及其他工具,先進(jìn)算力的需求已從訓(xùn)練轉(zhuǎn)向推理。AI代理是能夠相對(duì)自主地代表用戶執(zhí)行任務(wù)的系統(tǒng)。
許多構(gòu)建和運(yùn)營(yíng)AI代理的公司發(fā)現(xiàn),GPU成本過(guò)高、能耗過(guò)大,而且在實(shí)際運(yùn)行模型方面并非最佳選擇。隨著“代理式AI”(agentic AI)的迅猛崛起,英偉達(dá)正面臨開(kāi)發(fā)更低成本、更高能效推理芯片的壓力。
上個(gè)月,OpenAI與Cerebras簽署了一項(xiàng)價(jià)值數(shù)十億美元的計(jì)算合作協(xié)議。Cerebras提供專注于推理的芯片,該公司稱其芯片比英偉達(dá)GPU更快。
對(duì)英偉達(dá)而言,谷歌自研芯片張量處理單元(TPU)同樣也是重要挑戰(zhàn)者。事實(shí)上,谷歌正在推進(jìn)使TPU能夠取代GPU的計(jì)劃。
為了鞏固護(hù)城河,英偉達(dá)去年年底同意支付200億美元,以獲得Groq的關(guān)鍵技術(shù)授權(quán),并聘請(qǐng)其高層團(tuán)隊(duì),包括創(chuàng)始人喬納森·羅斯(Jonathan Ross)。這是硅谷歷史上規(guī)模最大的“人才并購(gòu)”(acqui-hire)交易之一。
Groq設(shè)計(jì)的芯片采用不同于英偉達(dá)的架構(gòu),被稱為“語(yǔ)言處理單元”(Language Processing Units),在推理功能方面效率極高。不過(guò),英偉達(dá)迄今尚未公開(kāi)說(shuō)明將如何運(yùn)用Groq的技術(shù)。








