这两天聊到RDNA 5的爆料,我挺能理解玩家那种“别又是堆规格、堆功耗”的警惕感。显卡这几年给人的观感就是:一代比一代猛,但也一代比一代更像在拼体格。可从目前传出来的方向看,RDNA 5更像是在练“巧劲”,尤其是它在指令并行这块想把路走顺。

先把一个容易被误解的点说清楚:所谓Dual Issue、双发射(也有人叫双通道并行),并不是什么突然冒出来的新发明。RDNA 3和RDNA 4其实就已经有双ALU通道的设计了,理论上一个时钟周期里可以扔两条指令进执行单元去跑。听上去很美,对吧?但问题一直卡在“理论”两个字上。

原因不复杂:硬件是有两条“车道”,可编译器要把代码整理成合适的“车队”,让两条车道都不空跑,这事儿没那么容易。现实里很多代码在编译和调度阶段没法被高效地分组配对,于是你看到的就是——硬件能力摆在那儿,利用率却上不去,双通道并行经常达不到理想效果。

RDNA 5被提到的关键变化,是引入了更有利于配对调度的FMA(融合乘加)能力。你可以把它理解成:以前编译器想把复杂的算术活儿拆开再拼成“刚好两条一组”的形态,挺费劲;现在有了更合适的指令形态,很多常见的计算能更自然地被配对,然后更轻松地喂给计算单元。这样一来,双通道并行就更可能跑到“该有的效率”,FP32的理论计算能力也就有机会做到翻倍这种级别的提升。

这事对玩家不只是“跑分好看”那么简单。放到传统光栅化游戏里,更高效的指令调度通常意味着两件很实在的体验:帧率更高,以及帧时间更稳。很多人升级显卡不光是为了平均帧,还为了少一点突然的卡顿和掉帧波动——而调度效率的提升,往往就是改善这类问题的底层因素之一。

另一个更现实的影响在AI相关负载上。现在显卡越来越多地要面对神经网络推理、图像重建这类工作,FMA这种指令优化对这类负载本来就很关键。按照爆料的说法,这种改进也会增强AMD下一代AI驱动的超分辨率与插帧路线,比如提到的FSR Diamond。对玩家来说,这意味着未来的“开超分”“开插帧”可能不只是画面变得更锐更顺,还可能更省资源、更稳定,至少方向上是对的。

话也别说满:现在毕竟还是曝光信息阶段,最终能不能把“理论翻倍”变成玩家手里的“体感提升”,还得看编译器、驱动、游戏适配这些环节能不能一起跟上。但就思路而言,我反而挺喜欢这种不靠暴力堆料、而是把并行效率做扎实的路线——因为它更可能带来长线收益,而不只是短期冲榜。

RDNA 5不靠“蛮力堆料”?AMD这次想用更聪明的并行把算力翻一倍