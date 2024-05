Sebbene NVIDIA abbia adottato il design chiplet (MCM) per le sue schede HPC/AI come B100 e B200, pare che voglia invece mantenere il package monolitico per le sue GPU consumer. Ma la storia potrebbe essere più complessa di così.

Secondo il solito ben informato Kopite7kimi , l'ammiraglia NVIDIA GeForce RTX 5090 sarà equipaggiata con una gigantesca GPU monolitica "Blackwell" GB202. Le specifiche preliminari parlano di ben 192 SM (Streaming Multiprocessors) che si tradurrebbero in 24.567 CUDA core, sempre che il chip mantenga il design a 128 core per SM visto nelle schede basate su AD102 "Ada".

Monolitico, o quasi?

Il tweet di Kopite7kimi sul design del die delle RTX 5090

Il processore grafico GB202 "Blackwell" dovrebbe avere un design monolitico e, stando alle indiscrezioni precedenti sulle specifiche di NVIDIA 5090, dovrebbe integrare il doppio degli SM e dei core rispetto a GB203, la GPU "tagliata" per schede come la GeForce RTX 5080. Questo si tradurrebbe in una differenza prestazionale enorme tra le due schede, posizionando la RTX 5090 come un vero mostro di potenza.

C'è tuttavia un dettaglio interessante: non possiamo ancora escludere del tutto la possibilità di un design "alla chiplet" nascosto sotto il cofano. Quello che potrebbe fare NVIDIA, infatti, è integrare due die GB203 in un pacchetto monolitico, senza che questo appaia come un design chiplet. Ciò consentirebbe una migliore comunicazione interna tra i die, evitando i colli di bottiglia tipici delle implementazioni chiplet tradizionali che puntano sulla comunicazione off-die.

È vero che NVIDIA ha già soluzioni per superare questi colli di bottiglia, come NVLINK e altre interconnessioni, ma queste aggiungono complessità alla GPU e possono diventare costose. NVIDIA, inoltre, ha già una soluzione consolidata con le schede GA100 e GH100, che sono essenzialmente due metà di un die più piccolo collegate da un'interconnessione, che comunicano attraverso una cache L2 divisa. Secondo Bryan Catanzaro di NVIDIA, questa implementazione migliora la scalabilità e la transizione iniziale a questo design è stata positiva.

Il tweet di Bryan Catanzaro sui die delle schede GA100 e GH100

Si prevede, infine, che il chip sia basato sul processo produttivo TSMC 4NP (5nm), che dovrebbe offrire una densità di transistor migliorata del 30%. Questo, unito agli aggiornamenti architetturali, dovrebbe tradursi in un notevole incremento delle prestazioni.

NVIDIA potrebbe quindi utilizzare lo stesso approccio anche per le schede gaming, il che significherebbe che, in futuro, potremmo vedere schede in stile B100/B200 basate su chiplet anche per il mondo dei videogiochi.