GPU芯片行業(yè)迎來一筆重量級融資。近日,專注于推理場景的GPU芯片企業(yè)曦望(Sunrise)對外披露,公司已在過去一年內(nèi)完成總額近30億元的戰(zhàn)略融資。本輪投資陣容涵蓋產(chǎn)業(yè)資本與財務(wù)投資者,包括三一集團旗下華胥基金、協(xié)鑫科技、正大機器人等產(chǎn)業(yè)方,IDG資本、高榕創(chuàng)投、中金資本等知名機構(gòu),以及具備國資背景的誠通混改基金等。
作為國內(nèi)首家完全聚焦推理場景的GPU芯片設(shè)計公司,曦望的前身可追溯至商湯科技的大芯片研發(fā)部門。2020年獨立運營后,公司確立了高性能GPU及多模態(tài)推理芯片的研發(fā)方向,核心團隊由前AMD、昆侖芯首席架構(gòu)師王勇與百度集團前副總裁王湛共同領(lǐng)銜。其中,王勇帶領(lǐng)的百人技術(shù)團隊曾主導完成兩代芯片的量產(chǎn)落地,王湛則負責推動產(chǎn)品商業(yè)化進程。
技術(shù)路線選擇上,曦望采取差異化競爭策略。區(qū)別于行業(yè)普遍追求的訓推一體架構(gòu),公司針對推理場景的特殊需求,對GPU底層架構(gòu)進行重構(gòu)優(yōu)化。通過改進調(diào)度算法、緩存機制、片上存儲及互聯(lián)架構(gòu),配合編譯器路徑的針對性調(diào)整,成功將單位Token推理成本降低至行業(yè)平均水平的三分之一。這種技術(shù)路徑源于對訓練與推理本質(zhì)差異的深刻認知——前者需要極致算力支撐參數(shù)迭代,后者則更強調(diào)多場景適配下的能效比與響應(yīng)速度。
產(chǎn)品布局方面,曦望已構(gòu)建覆蓋全場景的推理芯片矩陣。首款云邊端視覺推理芯片S1實現(xiàn)量產(chǎn)出貨超2萬片,第二代大模型推理芯片S2不僅完全兼容CUDA生態(tài),其性能指標更可對標英偉達A100。正在研發(fā)的第三代產(chǎn)品S3將重點突破多模態(tài)大模型推理,計劃通過架構(gòu)創(chuàng)新將計算成本壓縮至現(xiàn)有水平的十分之一,預計2026年進入量產(chǎn)階段。
團隊構(gòu)成顯示,曦望匯聚了來自NVIDIA、AMD、昆侖芯等企業(yè)的技術(shù)精英,目前規(guī)模已突破300人。值得注意的是,這并非該公司首次獲得資本青睞——今年7月,其已完成規(guī)模近10億元的Pre-B輪融資,投資方包括第四范式、游族網(wǎng)絡(luò)等產(chǎn)業(yè)資本及松禾資本等財務(wù)投資者。
在商業(yè)化落地層面,曦望的推理專用GPU展現(xiàn)出獨特優(yōu)勢。通過平衡通用性與性價比,其產(chǎn)品能夠為AI大模型提供更低功耗、更高穩(wěn)定性的推理服務(wù)。聯(lián)合CEO王湛指出:"當推理成本下降90%時,我們改變的不僅是芯片市場的競爭格局,更是整個中國AI產(chǎn)業(yè)的成本結(jié)構(gòu)。我們的使命是讓算力像水電一樣觸手可及,從而釋放通用人工智能的全部潛能。"









