在高性能GPU及多模態推理芯片領域,一家名為曦望的新興企業正以獨特的技術路線和戰略布局引發行業關注。這家脫胎于商湯科技大芯片部門的公司,自2024年底獨立運營以來,已構建起覆蓋視覺推理、通用計算及超低功耗場景的三代芯片產品矩陣,其"純推理"技術路線與英偉達等傳統廠商形成鮮明對比。
技術團隊構成彰顯著這家企業的專業底色。200余人的正式員工中,80%為技術研發人員,核心骨干平均擁有15年行業經驗,碩士及以上學歷占比超八成。董事長徐冰作為商湯科技聯合創始人,曾主導完成超66億美元融資及港交所IPO;聯席CEO王勇兼具AMD首席架構師與百度昆侖芯核心架構師雙重背景,主導過多款7nm芯片全流程開發;另一位聯席CEO王湛則是百度創始團隊成員,在芯片商業化領域擁有16年實戰經驗。
區別于行業主流的"訓推一體"架構,曦望選擇專注推理場景優化。通過重構調度機制、緩存設計及片上SRAM架構,融合LPDDR內存技術,其芯片在單位Token推理成本上實現數量級突破。據技術白皮書披露,正在研發的S3芯片將原生支持FP8/FP4低精度計算,目標將百萬Token推理成本壓縮至1分錢,較現有方案降低90%以上。
產品迭代軌跡印證著企業的技術積累。2020年量產的S1芯片作為國內首款視覺推理專用芯片,已向索尼、小米等企業授權IP;2024年推出的S2芯片實現CUDA生態兼容,成功適配DeepSeek、Qwen等主流模型;即將在2026年面世的S3芯片則定位"推理性價比之王",在能耗控制與計算密度上達到行業新高度。這種三代產品協同發展的格局,使其能夠覆蓋從邊緣設備到數據中心的完整推理場景。
商業落地層面,曦望已形成IP授權與芯片銷售雙輪驅動模式。S1芯片通過IP授權方式進入消費電子領域,S2芯片則直接切入AI算力市場,與多家云服務提供商達成合作意向。據內部人士透露,過去四年20億元的研發投入,主要聚焦在編譯器優化、芯片互聯等底層技術創新,這些積累正在轉化為顯著的成本優勢。
"當推理成本下降90%,我們改變的不僅是芯片市場格局,更是整個AI產業的成本結構。"王湛在近期技術分享會上強調。這種以極致性價比重構產業生態的思路,正吸引著越來越多合作伙伴加入其生態體系。隨著S3芯片量產臨近,這場由推理芯片引發的產業變革或將進入新的階段。











