繼學術界孵化出多個現象級 AI 引擎后,開源推理框架 vLLM 的核心成員正式宣布成立初創公司 Inferact。該公司以 8億美元的投前估值,成功完成了高達 1.5億美元的種子輪融資。
頂級資本加持,加速“推理”商業化本輪融資由 Andreessen Horowitz (a16z) 和 Lightspeed Venture Partners 共同領投。此舉證實了市場此前關于 vLLM 商業化路徑的猜測,也標志著 AI 行業的重心正從“模型訓練”全面轉向“應用推理”。
技術背景: Inferact 孵化自加州大學伯克利分校 Ion Stoica 教授(Databricks 聯合創始人)的實驗室。其核心技術 vLLM 通過創新的顯存管理技術,能顯著提升大模型運行速度并降低能耗。
市場地位: 首席執行官 Simon Mo 表示,vLLM 的開源版本已被亞馬遜云服務(AWS)及亞馬遜購物等巨頭廣泛采用。
推理賽道的“伯克利雙雄”Inferact 的亮相緊隨 RadixArk(由另一知名框架 SGLang 商業化而來)之后。后者近期剛獲得由 Accel 領投、估值4億美元的融資。兩家公司均出自伯克利實驗室,它們的接連獲投反映出投資者正不惜重金,搶占更快速、更經濟的 AI 部署技術高地。










