在生成式人工智能與基礎模型計算需求持續攀升的背景下,IBM研究院通過全棧式技術路徑,將人工智能計算能力深度融入系統產品體系,并推出基于該理念打造的IBM Spyre加速器。這款專為企業級應用設計的AI加速器,旨在解決復雜工作負載中多模型協同運行的挑戰,其核心設計兼顧了軟件無縫集成、硬件靈活適配以及企業級可靠性需求。
針對企業工作負載中決策自動化場景的特殊性,Spyre突破傳統加速器的單一功能定位,在優化推理性能的同時,完整覆蓋AI生命周期各階段需求。其架構設計采用"面向未來"理念,通過可編程數據流微架構與動態數字格式支持,確保從模型訓練到微調再到推理的全流程適配性。這種設計使加速器能夠隨企業需求演變,持續擴展應用場景邊界。
在硬件架構層面,Spyre AI內核采用創新的混合精度計算單元。每個內核包含兩個核心單元,每個單元集成8x8 SIMD脈動陣列與雙一維向量陣列。其中64個低精度引擎支持fp16/fp8/int8/int4運算,配合fp32精度的一維陣列,在保證能效的同時實現關鍵運算的精確控制。兩級可編程SRAM暫存架構與32個活動內核的環形互連設計,使系統峰值帶寬達到204GB/s,滿足大規模矩陣運算需求。
系統級芯片采用5nm CMOS工藝制造,集成256億晶體管。通過雙向環路連接32個活動內核與2個冗余內核,配合16通道LPDDR5內存控制器,在6.4Gbps數據速率下實現高效內存訪問。特有的DMA/RDMA流水線傳輸機制,使數據搬運與計算執行階段重疊,顯著提升多推理任務并行處理能力。這種設計使單張PCIe卡即可支持復雜AI模型的實時運行。
針對企業級應用的功耗約束,Spyre創新采用雙環電源管理方案。通過0.55V/0.75V多電源域劃分,結合軟件可控的峰值功耗調節機制,在標準PCIe插槽功耗范圍內實現性能動態優化。這種設計使加速器既能滿足IBM Z系統部署48張卡的擴展需求,也可適配Power系統16張卡的配置方案,為不同規模企業提供靈活的AI算力升級路徑。
軟件生態構建方面,IBM與多家軟件企業建立合作,打造基于Red Hat Linux的企業級軟件棧。以PyTorch 2.x為核心框架的解決方案,通過專用編譯器與運行時環境,實現應用程序零修改遷移。這種深度集成設計使金融、醫療等行業的現有AI系統,能夠快速獲得Spyre加速器的性能提升,同時保持原有開發流程的連續性。
通過獨特的可編程數據流架構與混合精度計算單元,Spyre在推理效率、性能密度與功能靈活性之間取得平衡。其企業級設計理念與開放生態策略,為生成式AI在關鍵業務場景的落地提供了新的算力解決方案,特別是在需要處理多類型模型協同運行的復雜工作負載中展現出顯著優勢。












