Mentre le GPU RDNA 4 continuano a dominare il mercato attuale, AMD sta già preparando il terreno per il prossimo salto tecnologico. Secondo quanto emerso dalle discussioni nella comunità open-source di LLVM, i prossimi processori grafici Radeon subiranno una trasformazione architettonica profonda, lontana dai semplici incrementi di potenza cui siamo abituati. Al centro di questa rivoluzione c'è un'ottimizzazione microarchitetturale che potrebbe sbloccare livelli di prestazioni finora rimasti teorici sulla carta.
Il fulcro della questione è il cosiddetto VOPD, acronimo di Dual Issue Execution, una tecnologia presente già da RDNA 3. In teoria, consente alle GPU di elaborare due istruzioni contemporaneamente nello stesso ciclo di clock, raddoppiando potenzialmente la velocità di elaborazione. La realtà, però, è stata ben più complessa: le regole severe di compatibilità tra istruzioni hanno limitato drasticamente l'utilità pratica di questa funzione, che riusciva a funzionare principalmente con operazioni a due operandi. I compilatori faticavano a trovare coppie di istruzioni sufficientemente compatibili da eseguire in parallelo, lasciando quindi risorse inutilizzate.
La svolta arriva con VOPD3, la nuova evoluzione del sistema che AMD sta sviluppando. Secondo le patch individuate nei codici del compilatore LLVM, il grande passo in avanti riguarda il supporto alle istruzioni a tre operandi. La modifica più rilevante introduce il supporto esplicito per l'istruzione V_FMA_F32, la celebre operazione Fused Multiply-Add in virgola mobile a precisione singola. Si tratta di un calcolo fondamentale in ogni motore grafico moderno, che unisce una moltiplicazione e una addizione in una sola operazione con un unico arrotondamento. Il risultato è maggiore precisione e efficienza rispetto all'esecuzione sequenziale dei due passaggi.
L'impatto pratico di questa modifica sarà immediatamente visibile sulle prestazioni FP32, il parametro che misura la velocità di calcolo in virgola mobile a singola precisione, quella massicciamente utilizzata negli shader e nei motori di rendering. Con VOPD3, gli shader potranno ridurre drasticamente i cicli di clock persi in attesa di istruzioni eseguibili, aumentando l'efficienza complessiva senza necessariamente moltiplicare il numero di processori o incrementare le frequenze di lavoro. In altre parole, AMD riuscirà a spremere più prestazioni dalla stessa quantità di silicio.
Le applicazioni pratiche di questo miglioramento vanno oltre il semplice gaming. Un ambito particolarmente importante è quello del rendering neurale, ovvero le tecnologie di upscaling e generazione di frame come FSR (FidelityFX Super Resolution) di AMD e sistemi simili di frame generation. Questi algoritmi si basano pesantemente su operazioni FMA nei loro modelli di intelligenza artificiale. Una migliore efficienza nell'esecuzione duale delle istruzioni si traduce direttamente in prestazioni superiori per queste funzionalità, aprendo la porta a miglioramenti ancora più incisivi nelle tecnologie di intelligenza artificiale applicate al gaming.