開(kāi)源技術(shù)社區(qū)近日披露,AMD正為其下一代GPU架構(gòu)RDNA 5實(shí)施關(guān)鍵性能優(yōu)化,通過(guò)硬件架構(gòu)革新與編譯器協(xié)同設(shè)計(jì),有望在特定工作負(fù)載下實(shí)現(xiàn)性能指數(shù)級(jí)提升。這項(xiàng)突破主要圍繞雙發(fā)射向量算術(shù)邏輯單元(Dual Issue VALU)的深度開(kāi)發(fā)展開(kāi),通過(guò)解決長(zhǎng)期存在的指令調(diào)度瓶頸,使理論算力得以充分釋放。
核心改進(jìn)在于引入融合乘加(FMA)指令集,該技術(shù)可自動(dòng)將復(fù)雜算術(shù)操作拆分為適配雙計(jì)算通道的指令對(duì)。相較于前代架構(gòu),新指令集使編譯器能夠更高效地組織計(jì)算任務(wù),徹底改變過(guò)去因指令對(duì)齊困難導(dǎo)致的硬件資源閑置問(wèn)題。測(cè)試數(shù)據(jù)顯示,在FP32單精度浮點(diǎn)運(yùn)算場(chǎng)景中,優(yōu)化后的架構(gòu)可實(shí)現(xiàn)接近100%的指令并行效率。
雙發(fā)射設(shè)計(jì)并非全新概念,AMD早在RDNA 3世代就已嘗試部署雙ALU通道架構(gòu)。但受限于編譯器技術(shù),前代產(chǎn)品在實(shí)際應(yīng)用中僅能發(fā)揮約60%的并行潛力。RDNA 5通過(guò)硬件指令集與軟件生態(tài)的協(xié)同創(chuàng)新,首次實(shí)現(xiàn)了計(jì)算單元的全利用率,為性能躍升奠定基礎(chǔ)。
游戲性能提升是此次優(yōu)化的直接受益領(lǐng)域。傳統(tǒng)光柵化渲染流程中,新架構(gòu)可穩(wěn)定維持更高幀率,尤其在復(fù)雜場(chǎng)景渲染時(shí),幀率波動(dòng)幅度較前代產(chǎn)品減少約40%。這項(xiàng)改進(jìn)對(duì)電競(jìng)顯示器等高刷新率設(shè)備具有特殊價(jià)值,可確保畫(huà)面流暢度與顯示設(shè)備刷新率精準(zhǔn)匹配。
AI計(jì)算領(lǐng)域同樣迎來(lái)重大突破。融合乘加指令集與雙發(fā)射架構(gòu)的組合,使神經(jīng)網(wǎng)絡(luò)推理效率獲得質(zhì)的提升。AMD下一代圖像超分技術(shù)FSR Diamond和幀生成算法將因此受益,在保持畫(huà)質(zhì)的前提下,實(shí)現(xiàn)更低的計(jì)算延遲和更高的輸出分辨率。技術(shù)文檔顯示,新架構(gòu)在執(zhí)行4K分辨率AI超分時(shí),能耗比提升達(dá)35%。
行業(yè)分析師指出,這項(xiàng)突破標(biāo)志著GPU設(shè)計(jì)進(jìn)入軟硬協(xié)同優(yōu)化的新階段。通過(guò)架構(gòu)創(chuàng)新彌補(bǔ)編譯器局限性的思路,可能引發(fā)新一輪軍備競(jìng)賽。目前AMD已向Linux內(nèi)核社區(qū)提交相關(guān)驅(qū)動(dòng)補(bǔ)丁,預(yù)計(jì)搭載RDNA 5架構(gòu)的產(chǎn)品將于2026年正式亮相。











