在AI算力軍備競賽愈演愈烈的當下,全球科技巨頭紛紛投入巨資布局AI基礎設施,數據中心如雨后春筍般涌現。然而,一個關鍵問題逐漸浮出水面:巨額投入的算力是否得到了充分釋放?國內RISC-V架構AI芯片領域的領軍企業(yè)奕行智能通過研究發(fā)現,當前各類AI加速器的實際利用率遠低于理論峰值,硬件性能的發(fā)揮受到軟件調度方式的嚴重制約。
針對這一行業(yè)痛點,奕行智能研發(fā)的基于Tile級虛擬指令集的動態(tài)調度架構(TISA)提供了創(chuàng)新解決方案。該架構通過構建編譯器與硬件之間的新型調度語義契約,使芯片能夠根據實時運行狀態(tài)自主決策任務分配,實現了算力資源的動態(tài)優(yōu)化配置。這項突破性成果已獲得國際認可,相關論文被計算機體系結構領域頂級會議ISCA 2026收錄,標志著中國AI芯片企業(yè)在核心技術路線設計上達到世界領先水平。
傳統(tǒng)AI芯片采用編譯時靜態(tài)調度模式,如同預先制定固定生產計劃,無法應對運行時的帶寬爭用、溫控降頻等突發(fā)狀況。即便部分現代GPU引入了線程束級動態(tài)調度,仍局限于CUDA Core內部指令協(xié)調,無法實現數據搬運單元、Tensor Core與CUDA Core的協(xié)同并發(fā)。TISA架構通過三項核心技術創(chuàng)新突破了這些局限:語義保留編譯器完整傳遞算子依賴關系等關鍵信息;Tile級指令集為每個計算任務配備標準化"任務說明卡";沖突感知運行時調度器以納秒級響應速度實現計算單元的動態(tài)負載均衡。
在FlashAttention-3注意力機制實現測試中,TISA架構展現出顯著優(yōu)勢:代碼量減少30%,同步調用次數降低50%,性能達到手工優(yōu)化基線的95%以上。更值得關注的是,這套指令流既可在奕行智能自研的EPOCH芯片上運行,也能適配其他第三方硬件平臺,首次在AI芯片領域實現了Tile粒度的跨平臺動態(tài)調度。這種技術路徑為云端大模型推理和端側AI部署等資源受限場景提供了高效解決方案,有助于行業(yè)擺脫單純追求算力規(guī)模的粗放發(fā)展模式。
作為國內首款基于RISC-V+RVV指令集架構的大算力芯片,EPOCH已于今年實現大規(guī)模量產出貨。該芯片采用類TPU架構設計,通過E Link互聯(lián)技術支持Scale Up與Scale Out融合組網,在RestNet50、BERT-Base等主流模型測試中,推理速度較國際競品提升25%-52%。在生態(tài)建設方面,奕行智能正與vLLM、Triton等開源社區(qū)深度合作,計劃開源虛擬指令集并舉辦RISC-V AI應用大賽,加速構建自主可控的AI算力生態(tài)。
奕行智能的技術突破反映了AI芯片設計范式的轉變:從靜態(tài)確定性設計轉向運行時智能優(yōu)化。這種轉變需要編譯器技術、硬件架構和生態(tài)系統(tǒng)的協(xié)同創(chuàng)新,為行業(yè)提供了在有限算力資源下實現更高能效比的新思路。隨著RISC-V架構在數據中心領域的加速滲透,以TISA架構為代表的動態(tài)調度技術有望重塑AI算力版圖,推動行業(yè)進入能效比競爭的新階段。











