AI推理芯片領域迎來新突破,初創企業Positron近日對外展示了其第二代ASIC芯片設計——Asimov。這款芯片被宣稱在Token能效與性價比方面表現卓越,可達到英偉達Rubin GPU的五倍水平,引發了行業廣泛關注。
Positron團隊深入分析后指出,當前Transformer推理運行的主要瓶頸并非算力,而是內存。基于這一洞察,Asimov芯片在設計上采取了內存優先的策略。通過優化設計,該芯片實現了高達90%的內存帶寬利用率,同時從架構層面減少了不必要的遠程數據傳輸,有效提升了數據處理效率。
從硬件配置來看,Asimov芯片由兩個計算模塊構成,每個模塊均配備了支持多種數據格式的脈動陣列。在內存方面,每個計算模塊直接連接432GB的LPDDR5x內存,并通過PCIe 6.0或CXL 3.0接口連接至多720GB的KV Cache緩存內存。整個芯片的熱設計功耗(TDP)為400W,內存總容量高達2304GB,總帶寬達到2.76 TB/s,且支持風冷散熱方案。
在系統集成方面,Asimov芯片支持16Tbps的芯片間互聯,可構建多樣化的拓撲結構。其推出的Titan推理服務器系統采用19英寸4U機架規格,集成了4顆Asimov芯片。該系統能夠支持16T參數模型的推理任務,并具備10M的上下文窗口容量。更引人注目的是,單個系統最多可擴展至4096套Titan,展現出強大的擴展能力。
據Positron公司透露,Asimov芯片的研發工作正在穩步推進,目標是在2026年底完成芯片流片,并計劃于2027年初正式投入量產。這一時間表的公布,讓業界對這款芯片的實際表現充滿期待。











