Eurogamer.it

Che cos'è un teraflop? - articolo

E fino a che punto definisce la potenza di calcolo nei videogiochi? Il Digital Foundry risponde.

Quando le prime specifiche di PlayStation 4 e Xbox One sono trapelate, dal confronto è emersa un'apparente disparità nelle loro prestazioni grafiche. La console di Microsoft, almeno inizialmente, era capace di 1.23 teraflops, mentre quella targata Sony di 1.84TF. Su carta, il divario sembrava vasto. Prima ancora che una singola console fosse stata venduta, Microsoft sembrava nei guai. I dati suggerivano che PS4 possedesse il 50% in più di potenza grafica, un dato molto importante per i giocatori ansiosi di vedere console next-gen più potenti possible.

Ora sembra che le parti si siano invertite con le prossime console. PlayStation 4K Neo è apparentemente dotata di 4.2TF, mentre Project Scorpio di Microsoft la sovrasta con circa 6TF, vale a dire un vantaggio del 43%. Tutto ciò ovviamente è affascinante ma la domanda è: cos'è un teraflop e fino a che punto quest'apparentemente grosso divario nelle specifiche è veramente indicativo delle prestazioni e dell'esperienza di gameplay?

Un 'flop' è un'operazione in virgola mobile, un'unità basica di potenza di calcolo. Applicandola alla tecnologia grafica AMD al centro delle console di Microsoft e Sony, il calcolo risulta molto semplice. Si moltiplica il numero di shader core della GPU per la velocità di clock. Nell'hardware AMD, vi sono 64 shader per unità computazionale. Xbox One ha 12 CU, PS4 18, per un totale di 768 e 1152 shader. Le velocità di clock sono rispettivamente di 853MHz e 800MHz.

PlayStation 4K Neo offre 4.2 teraflop di potenza di calcolo grafico. Ecco l'analisi di Rich sulle specifiche di Neo.

Il calcolo è quindi basilare ma dopo di questo si moltiplica il risultato per due, perché durante ciascun ciclo di clock vengono eseguite simultaneamente due istruzioni (una Multiply, una Accumulate). Ciò produce dei numeri enormi, che vengono razionalizzati in cifre digeribili come accade per lo spazio di storage di un tipico hard drive. Il risultato viene quindi diviso per un milione, dando come risultato i teraflop.

Ecco quindi i calcoli per Xbox One, PlayStation 4 e per le specifiche attuali di PlayStation 4K Neo:

  • Xbox One: 768 shader x 853MHz x 2 istruzioni per clock = 1,310,208 megaflops/1.31TF
  • PlayStation 4: 1280 shader x 800MHz x 2 istruzioni per clock = 1,843,200 megaflops/1.84TF
  • Neo: 2304 shader x 911MHz x 2 istruzioni per clock = 4,197,888 megaflops/4.2TF

Microsoft ha recentemente rivelato che la sua nuova console, Project Scorpio, è dotata di un core grafico da circa 6TF di potenza di calcolo, ma ha detto poco altro delle specifiche della GPU. In effetti abbiamo la parte finale dell'equazione, ma nessun'altra informazione in termini di velocità di clock o numero di shader. Nella nostra recente analisi dele specifiche di Project Scorpio, abbiamo utilizzato una combinazione di informazioni note e leak delle GPU Vega di AMD per stimare la configurazione del nuovo hardware di Microsoft.

  • Scorpio Scenario #1: 3584 shader x 840MHz x 2 istruzioni per clock = 6,021,120 megaflop/6.02TF
  • Scorpio Scenario #2: 3840 shader x 800MHz x 2 istruzioni per clock = 6,144,000 megaflop/6.13TF

La nostra ipotesi prevede una velocità di clock più bassa per Scorpio, visto che il processore sarà probabilmente molto più grande di quello di PlayStation Neo (processori più grandi generano più calore, e girano generalmente a velocità di clock inferiori). Stiamo presupponendo anche che Microsoft utilizzi la tecnologia Radeon Vega di AMD, che un leak conferma a 64 unità computazionali o 4096 shader, perché raggiungere i 6TF utilizzando la stessa tecnologia Polaris alla base di PlayStation Neo richiederebbe una velocità di clock del processore estrema.

  • Scorpio Scenario #3: 2304 shader x 1302MHz x 2 istruzioni per clock = 5,999,616 megaflop/6TF

In effetti, servirebbe una velocità superiore a quella della Radeon RX 480, su cui è basata la GPU di Neo, e un tale scenario è improbabile. In breve, a meno che Microsoft non abbia accesso a una GPU AMD next-gen assente dalla roadmap Radeon, si tratterà di una versione ridotta di Vega.

Cosa dovremmo aspettarci da Project Scorpio? Ecco quel che ne pensa Rich.

Fino a che punto i teraflop definiscono le prestazioni del sistema?

I teraflop sono un indice molto basilare della potenza di calcolo, separata e distinta da tutti gli altri aspetti del design di una GPU. Ad esempio, l'architettura GNC (Graphics Core Next) di AMD è sempre stata dotata di molta potenza di calcolo pura in confronto alle sue rivali Nvidia, motivo per cui le GPU Radeon sono andate così bene nell'era della corsa all'oro alla Cryptocurrency. Va però sottolineato che questo non si traduce necessariamente in prestazioni superiori nei giochi.

Un buon esempio è la comparazione dei 9TF della GTX 1080 di Nvidia con gli 8.6TF della Radeon R9 Fury X. In base alla semplice potenza di calcolo, ci si aspetterebbe che queste due schede grafiche offrano prestazioni simili, ma come dimostrato dai benchmark in 4K più in basso, la GTX 1080 risulta molto più veloce in tutti i titoli provati, tranne uno. Anche la più lenta GTX 1070, con i suoi 6.5TF, può surclassare agevolmente la Fury X in molti giochi. Inoltre, in termini di teraflop, la GTX 1070 risulta inferiore anche alla Titan X (7TF), che però eguaglia o surclassa.

I driver, vale a dire il software che gestisce l'hardware, sono importanti, ma lo è anche il design dell'architettura grafica stessa, così come altri aspetti quali la banda di memoria e le cache di memoria. Il confronto tra le componenti console può comunque essere indicativo per due ragioni: prima di tutto, perché gli elementi circostanti la GPU tendono a scalare in linea con la potenza di calcolo, e in secondo luogo perché le GPU di PS4 e Xbox One provengono dalla stessa famiglia e hanno in comune design molto simili.

Uno sugardo alle prestazioni in ambito 4K delle GPU di punta. La R9 Fury X di AMD vanta 8.6TF, ma fatica a tenere il passo dell'hardware Nvidia dotato di risorse minori.

3840x2160 (4K) GTX 1070 GTX 1080 Titan X R9 Fury X
Assassin's Creed Unity, Ultra High, FXAA 25.4 32.5 25.6 22.6
Ashes of the Singularity, Extreme, 0x MSAA, DX12 43.1 53.3 40.9 49.0
Crysis 3, Very High, SMAA T2x 31.5 40.1 31.3 31.4
The Division, Ultra, SMAA 31.0 37.3 30.7 31.1
Far Cry Primal, Ultra, SMAA 33.5 42.4 33.5 34.5
Rise of the Tomb Raider, Ultra, SMAA, DX12 35.6 45.8 35.9 29.6
The Witcher 3, Ultra, AA post-process, HairWorks Off 37.3 43.7 34.0 32.8
Project Cars, Ultra, SMAA 33.6 38.5 29.8 20.9

Il confronto tra Xbox One e Scorpio, così come quello tra PS4 e Neo, potrebbe però non essere così indicativo. Anche se AMD sta fornendo componenti grafiche con compatibilità completa verso la vecchia generazione, la nuova ondata di hardware GPU vanta anche miglioramenti architetturali. In breve, speriamo di avere prestazioni più efficienti. È qualcosa che potremo testare quando AMD lancerà la sua scheda grafica RX 460, dotata di 16 unità computazionali come la Radeon HD 7850 ma basata sul nuovo design Polaris. Dopo l'equalizzazione delle velocità di clock e della banda di memoria tra le due, effettuarne il benchmark dovrebbe teoricamente darci una buona idea dell'incremento nell'efficienza offerto dalle GCN di quarta generazione .

La conclusione è questa: su carta, Scorpio è 4,6 volte più potente di Xbox One, mentre Neo 2,3 volte in più di PS4. I design migliori della nuova tecnologia di AMD potrebbero però incrementare le prestazioni più di quanto pensiamo basandoci sui soli teraflop. È importante comunque sottolineare che un incremento del 40% nella potenza di calcolo non si tradurrà in prestazioni superiori del 40%.

Le prestazioni della GPU non crescono linearmente con la potenza di calcolo

In generale, stipare più unità computazionali in una GPU incrementa le prestazioni, ma per fare un esempio, il doppio dei teraflop non si traduce in frame-rate raddoppiati. C'è una moltitudine di potenziali ragioni per questo, ma solitamente un fattore fondamentale è il limite della banda di memoria.

Prendiamo come esempio la Radeon R9 380X. È una versione completamente attiva a 32 unità computazionali del chip Tonga. Nel confronto dei benchmark con la versione ridotta R9 380 (stesso chip, con 28 unità computazionali), vediamo un incremento nel frame-rate di solo il 10-15%, nonostante velocità di clock superiori e memoria più veloce, nonché più shader. La disparità tra le prestazioni e i teraflop tende ad aumentare man mano che il divario nelle specifiche della GPU si allarga. Microsoft sta facendo il meglio che può con Scorpio, supportando la sua GPU da 6TF con 320GB/s di banda di memoria, contro i 218GB/s di Neo.

La differenza tra teraflop e prestazioni in-game è visibile in certa misura anche su PS4 e Xbox One. I benchmark delle GPU delle console sono quasi inesistenti: i giochi tendono a girare con frame-rate limitati, e gli sviluppatori regolano le impostazioni qualitative di alcune componenti di rendering o cambiano le risoluzioni per gestire meglio le prestazioni. C'è però un'eccezione: Hitman di IO Interactive, che sembra girae a 1080p sia su PS4 che su Xbox One, con grafica identica e frame-rate sbloccato, una situazione molto vicina alle condizioni di benchmarking ideali.

Hitman di IO Interactive gira a frame-rate sbloccato e offre risoluzione e funzioni grafiche identiche, il che lo rende praticamente l'unico gioco su PS4 e Xbox One a dare un'idea delle prestazioni in scenari identici.

Nelle aree in cui la GPU è il fattore limitante, PlayStation 4 offre prestazioni superiori del 30%, nonostante una potenza di calcolo superiore del 40% (1.84TF contro 1.31TF), per non parlare dei vantaggi in fatto di banda di memoria (a seconda di come viene utilizzata la ESRAM di Xbox One). Hitman, però, può girare più velocemente su Xbox One in alcuni scenari, e questo ci porta al punto successivo.

Le prestazioni possono essere limitate anche dalla CPU

Hitman è un esempio interessante di come le prestazioni di un gioco possano essere limitate non solo dalla GPU ma anche dalla CPU. Il livello di Parigi è ricco di NPC, di cui il motore deve simulare il comportamento e gestire le animazioni. Questo lavoro è più adatto alla CPU, e sia PS4 che Xbox One montano la stessa architettura Jaguar di AMD, relativamente debole e pensata in origine per i dispositivi mobile. Per compensare, entrambi i produttori hanno raddoppiato il numero di core, che a essere onesti è una sorta di trucchetto. La differenza è che la console di Microsoft fa girare i core della CPU a 1.75GHz contro 1.6GHz di PS4, un vantaggio del 9,4% che dà i suoi frutti in alcune aree di Hitman.

Sony ha tentato di correggere il problema con Neo. Sembra che la tecnologia next-gen 'Zen' di AMD non sia ancora disponibile per l'integrazione conuna GPU in un singolo processore, quindi la compagnia giapponese ha fatto il meglio che poteva, vale a dire far girare lo stesso cluster a otto core a velocità di clock più alte: 2.1GHz su Neo contro 1.6GHz su PS4, un incremento prestazionale del 31,3%. Non sappiamo esattamente quale architettura utilizzi Project Scorpio, ma ci sono buone probabilità che Microsoft stia adoperando la stessa strategia di incrementare la velocità di clock dei core Jaguard pre-esistenti, o di una loro variante.

È questa la nostra preoccupazione principale riguardo a Neo e Scorpio: gli incrementi nella potenza di calcolo grafica sono enormi, ma non si accompagnano a un miglioramento simile della CPU. Ciò potrebbe spiegare perché il focus sia sulle risoluzioni 4K e non su frame-rate significativamente superiori: portare il gameplay da 30fps a 60fps (cosa che preferiremmo) richiederebbe molti più calcoli della CPU. Almeno in Neo, della quale conosciamo le specifiche, non vediamo nulla che possa raddoppiare le prestazioni in questo modo.

Pochi titoli sono limitati in maniera consistente dalla CPU, ma Assassin's Creed Unity è uno di essi, uno dei pochi dell'attuale generazione a mostrare un vantaggio consistente su Xbox One.

La conclusione: i teraflop non definiscono completamente la potenza grafica di una console

Non c'è una relazione diretta e lineare tra le prestazioni in-game e la potenza di calcolo misurata in teraflop, e anche se quest'ultima è utile a farsi un'idea delle prestazioni della GPU, la cosa funziona solo confrontando diversi hardware grafici basati sulla stessa architettura di base. Anche in questo caso, una GPU con un vantaggio del 40% su un'altra non offrirà un ritorno della stessa magnitudine in termini di prestazioni pure. Le capacità di un processore grafico non dipendono solo dalle potenza di calcolo: la banda di memoria, in particolare, è di vitale importanza.

È comunque chiaro che la GPU di Xbox One, da 12 unità computazionali e 1.31TF, è in svantaggio rispetto a quella di PS4, dotata di 18 unità computazionali e 1.84TF. La situazione è stata spesso esacerbata dalla banda di memoria, inferiore nella console di Microsoft. Tenendo presente il grosso divario nelle specifiche, gli sviluppatori hanno gestito in maniera ammirevole la situazione, offrendo esperienza quasi equivalenti in molti titoli multi-piattaforma, e la differenza principale è stata la risoluzione (ad esempio, 1080p vs 900p). In generale, comunque, PS4 ha spesso fornito anche frame-rate più stabili.

Tutto lascia intendere un simile divario nelle specifiche tra PlayStation 4K Neo e Project Scorpio, stavolta a favore di Microsoft, ma resta da vedere in che modo le specifiche si tradurranno nell'esperienza di gioco. Microsoft sembra intenzionata a puntare al gameplay a 4K nativi, una strategia che anche Sony sta considerando, anche se nel suo caso sembra più probabile l'upscaling da risoluzioni native inferiori. Trovandosi di fronte un hardware rivale più potente, forse Sony e gli sviluppatori stessi potrebbero cambiare bersaglio e puntare a sfruttare meglio l'esperienza full HD? Come abbiamo detto di recente, ci sono altre opzioni per le nuove console a parte le risoluzioni superiori...

Commenti (27)

I commenti ora sono chiusi. Grazie per avere partecipato!