2 月 5 日消息,AI 推理芯片初創(chuàng)企業(yè) Positron 當(dāng)?shù)貢r(shí)間公布了其第二代 ASIC 設(shè)計(jì) Asimov,宣稱該產(chǎn)品的 Token 能效與性價(jià)比都可以達(dá)到英偉達(dá) Rubin GPU 的五倍。
Positron 表示 Transformer 推理運(yùn)行的限制在內(nèi)存而非算力,因此 Asimov 在設(shè)計(jì)上就是以內(nèi)存優(yōu)先,擁有 90% 的內(nèi)存帶寬利用率,并從結(jié)構(gòu)上消除不必要的遠(yuǎn)程數(shù)據(jù)移動(dòng)。
Asimov 芯片由一對計(jì)算模塊組成,內(nèi)置支持多樣化數(shù)據(jù)格式的脈動(dòng)陣列。每個(gè)計(jì)算模塊連接到 432GB 的 LPDDR5x 內(nèi)存,并通過 PCIe 6.0 / CXL 3.0 連接到至多 720GB 的 KV Cache 緩存用內(nèi)存。其芯片整體 TDP 為 400W,內(nèi)存總?cè)萘?2304GB、總帶寬 2.76 TB/s,支持風(fēng)冷冷卻。
Positron Asimov 支持多樣化拓?fù)浣Y(jié)構(gòu)的 16Tbps 芯片間互聯(lián)。其 Titan 推理服務(wù)器系統(tǒng)采用 19 英寸 4U 機(jī)架規(guī)格,聚合了 4 顆 Asimov 芯片,支持 16T 參數(shù)模型推理和 10M 上下文窗口,單系統(tǒng)最多 4096 套 Titan。
Positron 表示 Asimov 芯片目標(biāo)在 2026 年底完成芯片流片,并在 2027 年初投入生產(chǎn)。











