近日,AI領(lǐng)域迎來一則重磅消息:開源推理框架vLLM的核心團(tuán)隊正式創(chuàng)立初創(chuàng)公司Inferact,并以8億美元的投前估值完成1.5億美元種子輪融資。本輪融資由Andreessen Horowitz(a16z)與Lightspeed Venture Partners聯(lián)合領(lǐng)投,為這家新銳企業(yè)注入強(qiáng)勁資本動力。
此次融資不僅印證了市場對vLLM商業(yè)化路徑的長期關(guān)注,更折射出AI行業(yè)戰(zhàn)略重心的遷移——從側(cè)重模型訓(xùn)練轉(zhuǎn)向強(qiáng)化應(yīng)用推理環(huán)節(jié)。據(jù)行業(yè)分析,推理環(huán)節(jié)的效率提升將直接決定AI技術(shù)的落地速度與成本結(jié)構(gòu),這成為資本競相布局的關(guān)鍵因素。
Inferact的技術(shù)基因可追溯至加州大學(xué)伯克利分校Ion Stoica教授實(shí)驗(yàn)室。作為Databricks聯(lián)合創(chuàng)始人,Ion Stoica團(tuán)隊研發(fā)的vLLM框架通過突破性顯存管理技術(shù),在保持模型精度的同時,將大模型運(yùn)行速度提升數(shù)倍,并顯著降低能耗。這種技術(shù)優(yōu)勢使其開源版本迅速獲得行業(yè)認(rèn)可,目前已被亞馬遜云服務(wù)(AWS)及亞馬遜電商等頭部企業(yè)采用。
值得關(guān)注的是,Inferact并非伯克利實(shí)驗(yàn)室孵化的唯一明星項(xiàng)目。與其形成"雙雄"格局的RadixArk同樣源自該校,該團(tuán)隊基于SGLang框架開發(fā)的商業(yè)化產(chǎn)品,近期剛完成由Accel領(lǐng)投的4億美元估值融資。兩家企業(yè)接連獲得頂級資本青睞,凸顯投資者對高效AI部署技術(shù)的戰(zhàn)略布局——通過優(yōu)化推理環(huán)節(jié),構(gòu)建更具成本效益的AI基礎(chǔ)設(shè)施。
據(jù)知情人士透露,Inferact計劃將本輪融資用于技術(shù)研發(fā)與生態(tài)建設(shè),重點(diǎn)拓展企業(yè)級客戶市場。隨著AI應(yīng)用場景的指數(shù)級增長,推理環(huán)節(jié)的效率瓶頸日益凸顯,這家擁有學(xué)術(shù)基因的初創(chuàng)企業(yè)能否突破技術(shù)天花板,將成為影響行業(yè)格局的重要變量。





