PlayStation 5 svelata: la carrellata di dettagli tecnici di Mark Cerny - analisi tecnica

Come nasce la next-generation.

Articolo di Richard Leadbetter Technology Editor, Digital Foundry

Altri articoli di Marco Procida, e Riccardo Cantù

Aggiornato il 03 Aprile 2020

Il 18 marzo Sony ha finalmente rotto il silenzio, offrendo una carrellata approfondita delle informazioni tecniche di PlayStation 5. Il lead Atchitect Mark Cerny ha esposto con grande perizia e minuzia di dettagli gli argomenti già accennati in precedenza, rivelando un sacco di nuove informazioni sulle specifiche tecniche di base della nuova console: potenza, banda di memoria, velocità e immersività. Un paio di giorni prima che Cerny andasse in diretta mondiale, il Digital Foundry aveva parlato proprio con il lead architect di PS5, discutendo degli stessi argomenti trattati. Una parte di quella chiacchierata è stata trattata, ma avevamo più informazioni. Molte di più.

Tutto quanto trattato in questo articolo è riferito agli argomenti della presentazione ufficiale di Cerny. C'è molto da imparare qui, ma non troverete nulla sulla strategia di PlayStation 5, e non c'è da stupirsi del perché. Infatti, quando lo abbiamo incontrato nel 2016, Cerny ci ha parlato della visione che Sony aveva delle generazioni di console, e l'hardware svelato certamente è in linea con quel pensiero. E quindi, lo sviluppo cross-generazionale sarà affidato agli sviluppatori first-party? Pur sottolineando che si riconduce tutto al concetto di generazione console (agli antipodi con l'approccio PC, che offre una innovazione graduale), non avrebbe parlato di strategie, anche perché non è decisamente una sua mansione all'interno dell'azienda.

Cerny è anche stato lead architect di PlayStation 4, che nel 2013 fu definita come “architettura PC supercharced”. Si trattava di un approccio che ha aiutato a creare la golden age dello sviluppo multipiattaforma. Ma PlayStation 5 è ritornata a sposare una filosofia più 'esotica' rispetto alla console precedente? Cerny non si è scucito molto a riguardo, affermando semplicemente che il design della PS5 è semplice per gli sviluppatori abili con lo sviluppo su PS4, ma scavando a fondo sulle capacità del nuovo sistema, ci sono molti aspetti nel design della nuova console che sono difficili da eguagliare su PC.

Comunque, nell'affrontare gli argomenti trattati nella sua conferenza per gli sviluppatori, Mark Cerny si accende. C'è una evidente passione ed un genuino entusiasmo per il nuovo hardware che lui ha aiutato a sviluppare, ed in questo articolo troverete tanto materiale per approfondire questa sua visione. Nel nostro meeting online abbiamo coperto svariati argomenti:

PlayStation 5 e l'innovativo boost clock: come funziona?
Cosa serve per la retrocompatibilità dal punto di vista della CPU?
Quali sono i vantaggi cruciali dell'SSD? E come si materializzano?
Come funziona l'audio 3D? E quanto è potente il Tempest engine?
Come si relazionerà il nuovo sistema audio 3D con gli altoparlanti Hi-Fi surround 5.1 e 7.1?

Quella che segue è senza dubbio un'analisi tecnica molto profonda, che rappresenta una possibilità di esplorare più incisivamente gli argomenti trattati durante la presentazione. Più volte, durante la nostra discussione, Cerny ci ha suggerito di fare più ricerche (ovviamente lì per lì non potevamo) e questa è una delle ragioni per cui non siamo andati online subito dopo l'evento con questo articolo. E non c'è quindi bisogno di specificare che prima di andare avanti vi raccomandiamo di guardare la presentazione di Cerny per intero e molto attentamente. La trovate proprio qui sotto, se non l'avete già fatto.

Cover image for YouTube video — La strada verso PlyStation 5: il reveal degli aspetti chiave di specifiche e feature della PS5 da parte di Mark Cerny.Guarda su YouTube

PlayStation 5 e l'innovativo boost clock: come funziona

Uno degli argomenti che ci interessava particolarmente approfondire era quello del boost clock di PlayStation 5: un'innovazione che essenzialmente dà al System-on-Chip un budget di potenza definita in base alla dissipazione termica del sistema di raffreddamento. Ha sorpreso che in questa presentazione Mark Cerny abbia ammesso le difficoltà nel raffreddare efficacemente PlayStation 4 e ha suggerito che avere una potenza disponibile definita avrebbe reso più semplice il compito. “Poiché non ci sono più misteri, non c'è bisogno di chiedersi quale consumo elettrico potrebbe causare il peggior scenario di un gioco", ha detto Cerny nella sua discussione. “Per quanto riguarda i dettagli del sistema di raffreddamento, penso che sarete abbastanza contenti di quello che ha implementato il team di ingegneri".

In ogni caso, il concetto cruciale è che c'è un livello di potenza impostato per il SoC. Sia che si parli di smartphone, tablet, o anche CPU e GPU per PC, le frequenze di clock di boost hanno sempre comportato performance variabili da un caso all'altro. Ma questo non può accadere su una console: la tua PlayStation 5 non può offrire prestazioni più scarse di quella del tuo amico. Le sfide a cui andrebbero incontro gli sviluppatori sarebbero titaniche, per usare un eufemismo.

"Non usiamo la temperatura del die, poiché questo causerebbe due tipi di variazioni tra le PS5. Una variazione sarebbe causata dalla differenza di temperatura ambiente; la console diventerebbe più calda in una stanza con una temperatura ambientale maggiore. L'altra variazione sarebbe causata dal calore intrinseco del chip della console: alcuni chip scaldano di più di altri, il silicio non è una scienza esatta. Quindi, invece di usare la temperatura del die, usiamo un algoritmo nel quale la frequenza dipende dalle informazioni di attività di CPU e GPU. Questo mantiene il comportamento delle PS5 abbastanza uniforme".

Dentro al processore c'è una unità di controllo della potenza, che misura costantemente l'attività di CPU, GPU e interfaccia di memoria, assegnando la natura dei compiti che sono in gestione. Invece di giudicare l'assorbimento di potenza dell'unità di silicio su cui è basato il processore della vostra PS5, viene usato un 'modello da SoC' più generico. Pensate a una simulazione del modo in cui il processore si comporta, e quella simulazione è usata nel cuore del monitoraggio di ogni PlayStation 5, assicurando stabilità per ogni unità.

"Il comportamento di tutte le PS5 è identico", assicura Cerny. "Se giocate lo stesso gioco e andate nella stessa location del gioco, non importa che custom chip abbiate e che tipo di transistor abbiate. Non importa se mettete il vostro mobiletto con la console in un congelatore, la vostra PS5 avrà le stesse frequenze per CPU e GPU di ogni altra PS5."

I feedback degli sviluppatori hanno evidenziato due aree in cui c'erano problemi. La prima era che non tutte le PS5 avrebbero girato alla stessa maniera, e questo è risolto dal Modello Soc. La seconda era la natura del boost. Le frequenze avrebbero raggiunto un picco per una determinata quantità di tempo prima di andare in throttling? In fondo, è così che il boost degli smartphone tende a funzionare.

"Il time contrast, che a detta di molti è il tempo che CPU e GPU impiegano per assumere la frequenza che rispecchia la propria attività, è critica per gli sviluppatori”, aggiunge Cerny. “É abbastanza breve e se il gioco sta eseguendo sequenze intensive dal punto di vista del power processing per un po' di frame, allora viene accelerato. Non c'è un lag in cui ci sono performance extra disponibili per diversi secondi o minuti e poi il sistema viene accelerato; non è un mondo in cui gli sviluppatori vogliono vivere: noi assicuriamo che la PS5 sia molto reattiva alla potenza consumata. In aggiunta al feedback degli sviluppatori, abbiamo il feedback sull'effettivo consumo di CPU e GPU".

Mark Cerny ha una visione di un tempo in cui gli sviluppatori inizieranno a ottimizzare i propri engine in un modo diverso, ovvero ottenere prestazioni ottimali in base al livello di potenza. “La potenza gioca un ruolo fondamentale nell'ottimizzazione. Se ottimizzi, mantieni lo stesso livello di potenza e allora inizi a vedere tutti i benefici dell'ottimizzazione. Quel che è davvero interessante riguardo all'ottimizzazione qui, è il consumo di corrente: se riesci a modificare il codice mantenendo lo stesso livello di performance ma abbassando il consumo elettrico, allora è una grande vittoria".

In soldoni, l'idea è che gli sviluppatori possano imparare a ottimizzare in un modo nuovo, ottenendo risultati identici dalla GPU, ma lo fanno aumentando le frequenze di clock grazie all'ottimizzazione dei consumi. “La CPU e la GPU hanno ognuna la propria riserva di potenza in watt, e ovviamente la GPU ne ha una quantità maggiore a disposizione”, aggiunge Cerny. “Se la CPU non usa tutta la sua riserva di potenza, per esempio, se il limite è 3,5GHz, allora la porzione di potenza disponibile alla CPU e non utilizzata viene riallocata alla GPU. Questa è la tecnologia che AMD chiama SmartShift. C'è abbastanza potenza perché CPU e GPU possano potenzialmente girare ai rispettivi limiti di 3,5GHz e 2,23GHz, non succederà che siano costretti a far girare una delle due più lentamente".

"C'è un altro fenomeno qui, che è chiamato 'corsa all'idle'. Immaginiamo che stiamo girando a 30Hz, e che stiamo usando 28ms dei 33ms disponibili, quindi la GPU sta inattiva (idle) per 5ms. Il controllo logico della potenza riconoscerà un basso consumo energetico (dopo tutto la GPU non sta facendo nulla per 5ms) e concluderà che quella frequenza dovrebbe essere incrementata. Ma questo aumento di frequenza è inutile”, spiega Cerny.

PS5 limita le frequenze di CPU e GPU a 3,5GHz and 2,23GHz rispettivamente, ma quanto sono stabili le frequenze?

A questo punto, le frequenze di clock potrebbero essere più alte, ma la GPU non ha lavoro da svolgere. Ogni aumento di frequenza è quindi inutile. “Il risultato è che la GPU non ha altro lavoro addizionale, e invece processa il lavoro che gli è stato assegnato più velocemente e dopodiché viene tenuta inattiva per più tempo, aspettando semplicemente per il v-sync. Usiamo la “corsa all'idle” per descrivere questo inutile aumento della frequenza della GPU”, spiega Cerny. “Se costruisci un sistema con frequenza variabile, quel che vedrai in base a questo fenomeno (e lo stesso si applica alla CPU) è che le frequenze sono usualmente pompate al loro massimo! Ma questo non è significativo, comunque; per definire in modo significativo la frequenza della GPU, occorre trovare una zona di un gioco in cui la GPU è utilizzata al 100% per raggiungere un frame time di 33.3ms.

"Quindi, quando ho affermato che la GPU gira per la maggior parte del tempo alla frequenza massima o ad un valore vicino a essa, questo è ottenuto con la “corsa all'idle” estrapolata dall'equazione: stavamo cercando giochi PlayStation 5 in situazioni in cui l'intero fotogramma fosse usato produttivamente. Lo stesso vale per la CPU, basandoci su situazioni in cui viene utilizzata pienamente per tutto il fotogramma, abbiamo concluso che la CPU passerà gran parte del suo tempo alla sua frequenza di picco”.

Semplificando il concetto, con la corsa all'idle rimossa dall'equazione e CPU e GPU utilizzate appieno, il sistema boost clock dovrebbe vedere entrambe le componenti girare al loro rispettivo picco di frequenza, o vicino a esso, per la maggior parte del tempo. Cerny ha anche sottolineato che il consumo di corrente e la frequenza di clock non sono relazionate in modo lineare. Ad esempio, ridurre la frequenza di clock del 10% riduce il consumo di corrente del 27%. “In generale, una riduzione di consumo di corrente del 10% implica solo un paio di punti percentuali in frequenza”, specifica Cerny.

Si tratta di un approccio del tutto innovativo, e anche se gli sforzi ingegneristici sono ingenti, Marc Cerny sintetizza così: “Una delle nostre scoperte è quella di realizzare che un set di frequenze rappresentavano il punto caldo, e ciò implicava che la densità termica di CPU e GPU era la stessa. E questo è quello che abbiamo fatto. Le due componenti sono in egual misura facili o difficili da raffreddare, o come volete dirlo".

Probabilmente c'è ancora qualcosa da scoprire sul dynamic boost e su come esso influenzerà il game design. Diversi sviluppatori con cui abbiamo parlato qui al Digital Foundry hanno affermato che la loro PS5 sembra ridurre la frequenza di clock della CPU per mantenere il massimo consentito sulla GPU, pari a 2,23GHz. E questo ha senso per la stragrande maggioranza di motori di gioco che al momento sono tarati con le scarse prestazioni della CPU Jaguar di PS4. Anche un raddoppio del frame-rate (da 30fps a 60fps) difficilmente impegnerebbe molto i core Zen 2 della console next-gen. Ma questa non sembra essere una soluzione di boost, quanto piuttosto una soluzione di profili prestazionali simili a quelli visti già su Nintendo Switch. “Riguardo ai profili bloccati, noi li supportiamo sui nostri kit di sviluppo, non sarebbe d'aiuto avere velocità di clock variabili in fase di ottimizzazione. I giochi PS5 rilasciati sul mercato avranno sempre frequenze di boost attive quando potranno avvantaggiarsi di potenza hardware aggiuntiva”, spiega Cerny.

Le frequenze di boost sono disegnate per essere mantenute sotto carico durante tutta l'elaborazione del fotogramma (potenzialmente è il caso del fotogramma a sinistra qui), invece che spararle al massimo solo quando la GPU ha meno lavoro da svolgere (destra).

Ma che succederebbe se gli sviluppatori non ottimizzassero in maniera specifica per il tetto di potenza della PlayStation 5? Ci chiediamo se ci possano essere frequenze da “scenario peggiore” a disposizione degli sviluppatori (un equivalente delle frequenze di base delle componenti PC). “Gli sviluppatori non hanno bisogno di ottimizzare in alcun modo; se necessario, la frequenza si adatterà al rendimento di CPU e GPU”, puntualizza Cerny. “Penso che stiate chiedendo cosa succede se c'è una parte di codice intenzionalmente scritto perché ogni transistor (o il massimo numero di transistor possibile) nella CPU e nella GPU lavorino a ogni ciclo. Beh, è una domanda quanto mai astratta, i giochi non si avvicinano minimamente al massimo consumo elettrico dell'hardware. Infatti, se un codice simile fosse scritto sulle console esistenti, il consumo di corrente andrebbe oltre le specifiche termiche previste e tollerabili, e la console si spegnerebbe automaticamente andando in protezione. PS5, comunque, sarebbe in grado di gestire una situazione simile in modo più adeguato".

In questo momento è difficile capire come funzioni esattamente il boost e quanto possano variare le frequenze di clock. E c'è anche confusione riguardo alla retrocompatibilità, dove l'affermazione di Cerny riguardante i migliori 100 giochi PS4 che saranno disponibili su PS5 con performance superiori, è stata fraintesa con “solo una piccola percentuale di titoli saranno disponibili al lancio”. Ma su questo, fortunatamente, è stata fatta chiarezza un paio di giorni dopo la conferenza (aspettatevi centinaia di giochi PS4 sulla nuova console) ma la natura della retrocompatibilità di PS5 è affascinante.

PlayStation 4 Pro è stata costruita per fornire performance più alte della console base e per aprire le porte ai display 4K, ma la compatibilità è stata la chiave. La console enhanced implementa una GPU “a farfalla” che in pratica raddoppia il core grafico, ma a parte un clock maggiore, la CPU è la stessa. PS5 ha invece una GPU RDNA 2 a cui è stata aggiunta una logica extra per assicurare la compatibilità con PS4 e PS4 Pro, ma come si inserisce la CPU all'interno dell'equazione?

"Tutta la logica di gioco creata per le CPU Jaguar funziona perfettamente sulle CPU Zen 2, ma i timing di esecuzione delle istruzioni possono risultare estremamente diversi”, spiega Cerny. “Abbiamo lavorato con AMD per personalizzare i nostri particolari core Zen 2; hanno modalità in cui possono approssimare i timing del Jaguar. Abbiamo questo vantaggio dalla nostra parte, mentre continuiamo a lavorare sulla compatibilità."

L'SSD proprietario: come funziona e a cosa serve

Fin dal primo reveal di PlayStation 5 nell'articolo di Wired, Sony ha sempre enfatizzato molto la presenza dell'SSD, una soluzione a stato solido proprietaria che dovrebbe cambiare le carte in tavola non solo in termini di tempi di caricamento ma anche nel modo in cui gli sviluppatori confezionerebbero mondi più grandi e dettagliati, facendo un uso molto più dinamico della memoria. Con l'impressionante larghezza di banda di 5.5GB/s e il decoding accelerato via hardware (che spinge la banda effettiva a circa 8-9GB/s), l'SSD di PlayStation 5 è un chiaro motivo di orgoglio per Mark Cerny e il suo team.

Gli sviluppatori potranno scegliere tra un accesso di basso o alto livello ma sono le nuove API I/O che permetteranno loro di sfruttare l'estrema velocità del nuovo hardware. Il concetto di file e percorsi è stato superato in favore di un nuovo sistema basato sugli ID, che dice alla macchina esattamente dove trovare tutti i dati che servono nel più breve tempo possibile. Gli sviluppatori devono semplicemente specificare l'ID, la locazione iniziale e quella finale, e dopo qualche millisecondo i dati vengono visualizzati. All'hardware vengono inviate due liste di comandi: una con l'elenco degli ID mentre l'altra si concentra sull'allocazione e la deallocazione della memoria (in modo da assicurarsi che la memoria sia sempre libera di accogliere nuovi dati).

Con una latenza di pochi millisecondi, i dati possono essere richiesti e visualizzati nel tempo di elaborazione di un singolo frame o, nei casi peggiori, in due. Questo è un fattore che va in netto contrasto con i tempi richiesti dai dischi rigidi, in cui lo stesso processo può richiedere fino a 250ms. Ciò significa che i dati possono essere gestiti in modo differente e più efficiente da parte della console. "Sto ancora lavorando sui giochi. Ho collaborato in veste di produttore su titoli come Marvel's Spider-Man, Death Stranding e The Last Guardian", dice Cerny. "Il mio lavoro era un misto di attività creative e di risoluzione di problemi. Per questo motivo ho potuto raccogliere molte informazioni sul funzionamento pratico dei sistemi."

Una delle problematiche maggiori era sempre legata al tempo necessario per reperire dati utili nell'hard drive con le relative difficoltà per gli sviluppatori. "Supponiamo che un nemico debba gridare qualcosa prima di morire: questa sarebbe una richiesta prioritaria ma avrebbe comunque dovuto sottostare ai 250 millisecondi necessari per ritrovare i dati giusti", spiega Cerny. "Quei 250 millisecondi sono un problema perché se il nemico deve gridare qualcosa, deve succedere istantaneamente. Questo è un tipo di situazione che in questa generazione ha forzato molti dati nella RAM di PS4."

L'SSD di PS5 è basato su un'interfaccia a 12 canali connessa con chip NAND flash individuali, gestiti da un controller flash personalizzato.

In breve, per avere accesso istantaneo ai dati più urgenti, molti di essi devono essere posizionati nella RAM, nella corrente generazione di console (il che significa che nelle macchine next-gen si potranno risparmiare diverse risorse, in tal senso). L'SSD alleggerisce molto il carico di lavoro semplicemente perché i dati possono essere richiesti quando servono, invece di essere ammassati nella cache nell'eventualità di un loro ipotetico utilizzo. In aggiunta a questo si possono risparmiare ulteriori risorse eliminando i duplicati che non servono più. Gran parte della latenza tipica dei dischi rigidi è dovuta al fatto che la testina meccanica deve muoversi lungo tutta la superficie del disco: trovare i dati può richiedere un tempo uguale (o superiore) a leggerli. Per questo motivo gli stessi dati vengono spesso duplicati centinaia di volte per assicurarsi che il drive possa leggerli velocemente, invece che perdere tempo a trovarli.

Senza duplicazione, le performance del drive si abbatterebbero completamente: il target di circa 50MB/s o 100MB/s di dati arriverebbe a toccare anche gli 8MB/s. La duplicazione incrementa molto la velocità del processo ma, ovviamente, ciò si traduce in molto spazio sprecato sul disco stesso. Per Marvel's Spider-Man, Insomniac ha trovato una soluzione elegante ma, ancora una volta, essa faceva pesante uso della RAM.

"La telemetria è fondamentale per individuare possibili problematiche in un sistema del genere. Quest'ultima, ad esempio, ha mostrato che il database della città aumentava di dimensioni di circa un gigabyte, durante la notte. È saltato fuori che la causa di questo problema era legata ai sacchi dell'immondizia da 1.6MB, un asset non particolarmente pesante ma che, durante la notte, veniva incluso in circa 600 isolati della città", spiega Mark Cerny. "In Insomniac vige una regola: se un asset viene utilizzato più di quattrocento volte, viene posizionato nella RAM. Per questo motivo i sacchi dell'immondizia sono stati spostati lì anche se, chiaramente, non c'è un limite di asset che possono risiedere nella RAM."

È solo un altro esempio di come l'SSD possa dimostrarsi essenziale per i titoli next-gen. Le dimensioni di installazione di un gioco saranno più ottimali perché la duplicazione dei dati non è più necessaria. Quei sacchi dell'immondizia dovranno esistere una volta sola sull'SSD, non in centinaia o migliaia di copie, e non dovranno mai essere posizionati nella RAM. Gli asset verranno caricati con una latenza e una velocità di trasferimento sensibilmente maggiori rispetto al passato, il che si tradurrà in un approccio più preciso all'acquisizione dei dati che farà meno uso delle cache.

Nel frattempo, il sistema di compressione dedicato Kraken, il controller DMA, gli engine di coerenza e i co-processori I/O, garantiranno agli sviluppatori la possibilità di sfruttare la velocità dell'SSD senza modificare il codice per trarre il meglio da questa soluzione a stato solido. Il controller flash, infine, assicura prestazioni di altissimo livello: gli sviluppatori dovranno solo utilizzare le nuove API. È un ottimo esempio di come questa nuova tecnologia potrà fornire ai giochi dei benefici istantanei senza ulteriori investimenti da parte dei creatori.

Audio 3D: la potenza del Tempest Engine

I piani di Sony per l'audio 3D sono rivoluzionari ed ambiziosi. Per dirla in parole semplici, per PlayStation 5 l'azienda si sta spingendo oltre rispetto a tutto ciò che abbiamo visto mai visto finora nel mondo del gaming, elaborando centinaia di fonti sonore in un ambiente 3D, al contrario delle sole 32 garantite dal Dolby Atmos. Come se non bastasse, tutto ciò sarà offerto ai giocatori senza la necessità di acquistare equipaggiamento audio aggiuntivo.

La precisione supplementare nel suono surround è un processo evolutivo che ha interessato PS3, PS4 e anche PSVR che è capace di supportare circa 50 fonti sonore tridimensionali. Ricordando questa intervista con Garry Taylor e Simon Gumbleton di Sony, è affascinante constatare quanti di quei concetti siano stati utilizzati come base per l'Head-Related Transfer Function (HRTF) di PS5.

In generale, la portata delle ambizioni di Sony nel campo dell'audio è straordinaria se non altro per via del fatto che il suono viene processato a 48000Hz con 256 campioni. Ciò significa che ci sono 187.5 'battiti' al secondo e che ogni nuovo elemento audio deve essere fornito al sistema ogni 5.3ms. Provate a immaginare quanti dati devono essere elaborati ad ogni battito.

Per questo motivo è stato adottato il sistema HRTF per l'audio di PS5. Nella sua presentazione, Mark Cerny ha mostrato a tutti il suo grafico HRTF che, essenzialmente, è una tabella che mappa la percezione dei suoni sulla base della forma e delle dimensioni della testa dell'utente. Va considerato, però, che le nostre orecchie spesso non sono identiche e che per raggiungere un risultato accurato bisogna produrre due HRTF, uno per ciascun orecchio.

L'elaborazione dell'audio non è un argomento semplice: la soluzione pensata da Sony vuole garantire la qualità senza compromessi sulla fedeltà.

"Se le discussioni circa l'HRTF possono causare qualche grattacapo, ci sono altri nuovi concetti riguardanti la localizzazione sonora che sono più semplici da descrivere; ossia l'ILD e l'ITD", spiega Mark Cerny. "L'ILD è il differenziale interaurale che, in termini semplici, è la differenza di intensità con cui il suono raggiunge in ciascun orecchio. Esso può variare di frequenza e posizione: se la fonte sonora è alla mia destra, il mio orecchio sinistro riceverà meno frequenze più basse e molte meno frequenze alte, perché i suoni a bassa frequenza possono diffrangersi attorno alla testa mentre quelli ad alte frequenze non possono farlo. Di conseguenza, l'ILD varia in base alla provenienza del suono e alla sua frequenza oltre alla forma e dimensione della testa dell'utente. L'ITD, il ritardo interaurale, invece, rappresenta il tempo necessario al suono per raggiungere l'orecchio destro rispetto al sinistro.

"Ovviamente se la fonte sonora è posta davanti a voi, il ritardo interaurale è pari a zero. Se la fonte è a destra, invece, il ritardo è determinato dalla velocità del suono divisa per la distanza tra le orecchie. L'HRTF che usiamo negli algoritmi per l'audio 3D comprende anche l'ILD, l'ITD e altro ancora."

L'HRTF, essenzialmente, è una griglia 3D con i valori che possono essere utilizzati per determinare la posizione di un oggetto tenendo in considerazione IAD e ITD ma non ha la granularità per coprire ogni singola posizione. A rendere il processo più complesso ci pensa il cervello umano e la sua incredibile precisione. Perciò gli algoritmi devono essere straordinariamente efficienti.

"Per stabilire l'efficienza dei nostri algoritmi utilizziamo il cosiddetto pink noise, un concetto molto simile al white noise (con cui abbiamo più confidenza). Utilizziamo una fonte sonora e la facciamo muovere in giro: se avvertiamo una variazione in quel suono durante il movimento sappiamo che c'è un difetto nel nostro algoritmo", aggiunge Cerny.

In definitiva, il pink noise e il white vengono filtrati per approssimare la frequenza di risposta dell'orecchio umano. Se l'algoritmo è inaccurato, si avvertiranno dei difetti simili al tipo di suono che si ascolta mettendo una conchiglia sull'orecchio. Questa era una delle limitazioni del sistema audio 3D di PlayStation VR ma, grazie alla potenza extra del Tempest Engine di PS5, gli algoritmi dovrebbero garantire maggiore precisione per un suono più realistico e pulito.

In verità, c'è anche tanta altra matematica dietro tutto questo. "La ragione per cui il diagramma HRTF della presentazione era così complesso è perché volevamo dare a tutti un'idea di quanto fosse complicato il processo per l'elaborazione di un suono in movimento. Proprio per questa ragione abbiamo adottato un'unità audio dedicata", aggiunge Mark Cerny. "Essenzialmente, volevamo avere a disposizione un quantitativo di potenza indefinito per affrontare qualsiasi tipo di sfida ci si parasse davanti. Non volevamo che il costo di un particolare algoritmo fosse la ragione per cui lo avremmo scelto. Volevamo semplicemente concentrarci sulla qualità dell'effetto finale."

L'elaborazione dell'audio via HRTF adegua l'output audio a specifiche caratteristiche delle orecchie di ciascun individuo.

Il Tempest Engine, dal canto suo, è un unità di calcolo di AMD modificata che gira alla frequenza della GPU e fornisce 64 flop per ciclo, come ha spiegato Cerny nella sua presentazione. Il picco delle performance dell'engine è di circa 100 gigaflop, comparabile all'intero cluster della CPU Jaguar a otto core usata in PS4. Nonostante sia basato sull'architettura della GPU, il suo utilizzo è molto, molto differente.

"Le GPU elaborano centinaia o migliaia di fronti d'onda allo stesso tempo mentre il Tempest Engine lavora solo su due", spiega Mark Cerny. "Uno riguarda l'audio 3D ed altre funzionalità di sistema mentre l'altro è dedicato ai giochi. A livello di larghezza di banda, il Tempest può fare affidamento su più di 20GB/s ma dobbiamo essere attenti perché non vogliamo che il lavoro sull'audio comprometta i processi legati alla grafica. Se l'audio dovesse utilizzare troppa banda, ciò potrebbe avere un effetto deleterio sulla grafica: non vogliamo saturare tutta la banda del sistema nello stesso momento."

Essenzialmente, la GPU è basata sul principio del parallelismo, sull'idea di gestire diverse attività (o onde) simultaneamente. Il Tempest Engine è più di natura seriale, il che significa che non ha bisogno di cache di memoria dedicate. "Quando utilizziamo il Tempest, acquisiamo i dati tramite DMA (Direct Memory Access, Accesso diretto alla Memoria), li elaboriamo e eseguiamo un nuovo DMA del prodotto, proprio come accadeva nell'SPU di PS3", aggiunge Cerny. "È un processo molto diverso rispetto a quello della GPU poiché queste ultime hanno le cache di memoria che possono rilevarsi preziosissime in alcuni momenti ma anche tradursi in rallentamenti in determinati casi. Le GPU, inoltre, possono andare in stallo per altri motivi: ci sono diverse fasi nella pipeline della GPU e ciascuno di questi stadi è propedeutico al successivo. Di conseguenza, se nella GPU abbiamo un utilizzo del VALU del 40%, il sistema sta lavorando bene. Al contrario, nel Tempest Engine, l'obiettivo è quello di raggiungere il 100% dell'utilizzo del VALU in sezioni chiave del codice."

Il Tempest Engine, inoltre, è compatibile con Ambisonics che, effettivamente, è un sistema di speaker virtuali che possono essere mappati su quelli fisici. Tutto questo si traduce in un feeling migliorato perché ciascun suono può essere renderizzato in 36 livelli di volume e, con ogni probabilità, verrà riprodotto su tutti gli speaker. L'audio discreto rende a 'bloccarsi' sui soli speaker fisici e potrebbe non essere riprodotto su ognuno di essi. Ambisonics è già disponibile su PS4 e PSVR con meno speaker virtuali perciò il Tempest rappresenta un buon passo avanti già per questo motivo.

"Stiamo valutando diverse strategie per l'audio dei giochi in cui il tipo di elaborazione dipende da ogni specifica fonte sonora", dice Cerny. "Per esempio, un 'hero sound' (cioè un suono di particolare rilevanza), riceverà il trattamento per gli oggetti 3D mentre la maggior parte degli altri suoni delle varie scene passeranno attraverso Ambisonics per avere un controllo maggiore sui livelli dell'audio. Con questo tipo di approccio ibrido, in teoria, si può avere il meglio di entrambi i metodi. Dal momento che entrambi vengono processati sulla base dei grafici HRTF, riceveranno lo stesso meraviglioso senso di presenza."

Come si collegherà l'audio 3D di PS5 al vostro hardware

Durante la presentazione di PlayStation 5 è stato sottolineato che il lancio dell'audio 3D potrebbe richiedere qualche tempo. Sebbene la tecnologia alla base sia già pronta, per veicolarla nei vari sistemi di altoparlanti a disposizione degli utenti servirà ancora molto lavoro. Al lancio, i giocatori che utilizzano le cuffie dovrebbero avere l'esperienza completa mentre il discorso potrebbe complicarsi per chi fa affidamento sugli speaker della TV, le soundbar o i sistemi surround 5.1/7.1.

"Nel caso degli speaker della TV o degli altoparlanti stereo, gli utenti potranno decidere se attivare o disattivare il 'TV Virtual Surround' in modo che la pipeline audio possa produrre suoni privi degli aspetti 3D di cui stavamo parlando", aggiunge Mark Cerny. "Il Virtual Surround funziona bene solo in determinate circostanze e i giocatori potrebbero non trovarsi nella situazione ideale. Quando il Virtual Surround è attivo vengono impiegati gli algoritmi basati su HRTF. Se, invece, viene disattivato viene eseguito un mix standard (per esempio la posizione di un oggetto sonoro 3D viene determinato da quale angolazione proviene rispetto a ciascuno speaker)."

"Una volta che saremo soddisfatti della nostra soluzione per questi sistemi a due canali, ci sposteremo sui sistemi 5.1 e 7.1", aggiunge Cerny. "Per il momento, sebbene sia il 5.1 che il 7.1 riceveranno una soluzione simile a quella già disponibile su PS4. È bene notare che il supporto ai canali surround 5.1 e 7.1 hanno determinate sfide da superare: se già i dispositivi a due canali possono avere qualche problema, figuratevi un sistema a 6 o 8 canali!"

Il supporto inizierà principalmente dalle cuffie. Il virtual surround è il passo successivo mentre il supporto ai sistemi 5.1 e 7.1 arriverà in seguito.

Cosa c'è nel futuro di PlayStation 5?

Ci sono ancora molte incognite circa PlayStation 5. Nella sua presentazione, Mark Cerny ha menzionato che un'analisi completa della console verrà resa disponibile nel prossimo futuro. Proprio in quel momento avremo le prime informazioni circa la soluzione di raffreddamento adottata, uno degli elementi più importanti per l'intera architettura del sistema e per il suo form factor. Speriamo di non dover attendere troppo!

Fondamentalmente ci sono ancora parecchi punti interrogativi. Sia Sony che AMD hanno confermato che PlayStation 5 utilizzerà un chip grafico custom basato su RDNA 2 ma il recente annuncio di DirectX 12 Ultimate ha costretto AMD a rivelare l'inclusione di nuove feature mai menzionate da Sony come, ad esempio, il Variable Rate Shading. Tra il dire e il fare, come dice il proverbio, c'è di mezzo il mare: ciò che Sony ha annunciato in termini di specifiche è innegabilmente impressionante ma la prova del nove saranno sempre i risultati finali nei giochi. A parte un breve filmato fuori fuoco riguardante Marvel's Spider-Man lanciato da un dev-kit, non abbiamo ancora visto nulla di concreto.

Per concludere, ciò che ci aspettiamo di vedere da Sony a stretto giro è un assaggio dell'esperienza effettiva di PlayStation 5. Nella strada che aveva portato al lancio di PS4, di questi tempi, avevamo già visto una clip di Killzone Shadowfall che aveva mostrato risultati magnifici. Sì, i giochi sono importanti ma ci piacerebbe dare uno sguardo anche agli elementi accessori della console: quanto ci mette ad avviarsi? I caricamenti sono davvero così veloci? C'è un equivalente dell'impressionante feature Quick Resume di Series X? I titoli PS4 gireranno con frame-rate sbloccato o con un blocco a 60fps? Più ci pensiamo e più domande ci vengono in mente. Per quanto possiamo dire di conoscere l'architettura di PS5, siamo ancora davvero all'inizio.