據(jù)知情人士透露,全球 AI 領(lǐng)軍企業(yè)OpenAI近期正積極系統(tǒng)性地尋找英偉達(dá)之外的算力替代方案。這一動(dòng)作源于其對(duì)英偉達(dá)最新一代 AI 芯片在特定推理環(huán)節(jié)(尤其是響應(yīng)速度)表現(xiàn)的失望。
核心痛點(diǎn):推理速度制約用戶體驗(yàn)
OpenAI發(fā)現(xiàn),在代碼生成及復(fù)雜的軟件系統(tǒng)交互用例中,現(xiàn)有硬件的響應(yīng)速度已成為瓶頸:
戰(zhàn)略重心偏移:OpenAI正在將關(guān)注點(diǎn)從模型“訓(xùn)練”轉(zhuǎn)向“推理”(即向終端用戶輸出答案的過程)。
延遲與吞吐:推理階段的性能直接掛鉤用戶體驗(yàn)與運(yùn)營(yíng)成本。在高帶寬、低延遲的特定任務(wù)下,傳統(tǒng) GPU 架構(gòu)因需頻繁訪問外置顯存而產(chǎn)生的延遲,讓芯片長(zhǎng)時(shí)間處于“等數(shù)據(jù)”狀態(tài)。
專業(yè)用戶的高要求:CEO 山姆·奧特曼指出,開發(fā)者等專業(yè)用戶對(duì)代碼類模型的生成速度極度敏感,而當(dāng)前的硬件架構(gòu)限制了相關(guān)產(chǎn)品的體驗(yàn)。
替代方案:牽手推理加速“新勢(shì)力”
為了解決硬件瓶頸,OpenAI計(jì)劃引入新型硬件來分擔(dān)未來約10% 的推理算力需求:
引入 Cerebras:OpenAI已與 Cerebras 達(dá)成合作。后者的架構(gòu)在同一塊芯片中集成了海量靜態(tài)存儲(chǔ)(SRAM),能極大地縮短訪問路徑,提升響應(yīng)速度。
洽談 Groq:公司此前也曾與 Groq 接觸,尋求利用其推理加速特長(zhǎng)來優(yōu)化聊天機(jī)器人等 AI 系統(tǒng)。
巨頭博弈:原本“板上釘釘”的投資生變
這種技術(shù)路線的調(diào)整也讓OpenAI與長(zhǎng)期核心供應(yīng)商英偉達(dá)的關(guān)系變得微妙:
千億交易停滯:雙方原本正在洽談一項(xiàng)涉及1000億美元 的投資與供貨協(xié)議(英偉達(dá)以芯片換股權(quán)),但該談判已拖延數(shù)月。
采購(gòu)多元化:OpenAI已經(jīng)與 AMD 等其他廠商簽署了新的 GPU 采購(gòu)或合作協(xié)議,進(jìn)一步分散了對(duì)單一供應(yīng)商的依賴。
競(jìng)爭(zhēng)壓力:相比之下,Anthropic 的 Claude 以及谷歌的 Gemini 更多依賴谷歌自研的 TPU,這種專用芯片在推理任務(wù)上的天然優(yōu)勢(shì)給了英偉達(dá)巨大壓力。
盡管雙方在公開場(chǎng)合仍維持積極的合作形象,英偉達(dá)CEO 黃仁勛也極力否認(rèn)不和傳聞,但隨著OpenAI開始真金白銀地為第三方推理芯片下單,AI 算力市場(chǎng)的“一超多強(qiáng)”格局正面臨重塑。











