NVIDIA GeForce RTX 4000: informazioni e rumor su Lovelace e Hopper

A partire dalle indiscrezioni ecco quello che sappiamo della prossima famiglia di schede video NVIDIA: le GeForce RTX 4000.

Da una settimana abbondante si parla con forza della prossima generazione di schede video NVIDIA, le future GeForce RTX 4000 che andranno a rimpiazzare la famiglia 3000 basata sull'architettura Ampere.

Ci rendiamo assolutamente conto di quanto sia assurdo parlare già di Serie 4000 o 3000 Super, quando ancora oggi risulta praticamente impossibile riuscire a portarsi a casa una 3070, una 3080 o una nuovissima 3060 Ti. Però è così che va il mercato tecnologico: chi si ferma è perduto ed è fondamentale guardare costantemente in avanti.

In base a tutta una serie di di leak, voci di corridoio, indiscrezioni e rumor che hanno iniziato a rimbalzare da metà dicembre, sembra infatti che NVIDIA abbia modificato sostanzialmente la sua tabella di marcia, da una parte accelerando con l'obiettivo di ostacolare l'avanzata inesorabile di AMD e dall'altra rimandando quello che promette già di essere un cambio radicale del sistema produttivo e del design delle sue GPU.

Oggi faremo quindi il punto della situazione su Lovelace, il nome in codice della prossima architettura che sarà alla base delle GeForce RTX 4000. Faremo qualche ipotesi su quando dovrebbe arrivare sul mercato e vi parleremo delle specifiche che, ve lo diciamo già, sembrano fantascientifiche.

Non mancheremo però di raccontarvi qualche dettaglio anche di Hopper, la successiva architettura, quella che dovrebbe rappresentare un cambio radicale nelle GPU di NVIDIA e che, a quanto pare, si farà attendere più a lungo del previsto.

Ada Lovelace

Ormai è da più di un decennio che NVIDIA ha scelto di nominare le sue architetture in funzione di famosi e rivoluzionari scienziati, matematici e inventori del passato, non necessariamente legati all'informatica ma comunque relativi a un qualche, importante, progresso tecnologico. E così, dopo un lunghissimo periodo di esponenti maschili, ricordiamo tra i più recenti Pascal, Turing e Ampere, rispettivamente legati alle GeForce GTX 1000 e alle RTX 2000 e 3000, ad aspettarci in futuro ci saranno 2 architetture dedicate a scienziati di sesso femminile: Ada Lovelace e Grace Hopper.

La Lovelace è considerata da moltissimi studiosi la prima, vera fanatica del calcolo computerizzato, anche se ai suoi tempi il computer non era stato neanche ipotizzato. Fu la prima persona a teorizzare che la macchina analitica di Charles Babbage, una sorta di prototipo di computer mai concretamente costruito, potesse essere utilizzata per andare oltre i puri e semplici calcoli matematici e, a questo proposito, scrisse quello che viene considerato il primo vero algoritmo, diventando a tutti gli effetti la prima programmatrice di software dell'umanità. E il bello è che lo è diventata mezzo secolo prima che Alan Turing costruisse il primo computer programmabile durante la seconda guerra mondiale.

In realtà c'è un po' di indecisione sul nome di questa architettura. Stando a una manciata di documenti interni trafugati, NVIDIA si riferisce alla nuova GPU con il nome in codice Ada, mentre nelle vecchie presentazioni ufficiali che presentavano già ipotesi di nomi di architetture future, si parlava di Lovelace. Probabilmente, alla fine, NVIDIA punterà sul nome più breve e semplice: Ada, lasciando da parte il cognome della scienziata.

Processo produttivo

Il primo, importantissimo punto di rottura con il passato è nel processo produttivo. Le attuali GPU della famiglia 3000 Ampere, sono fabbricate nelle fonderie Samsung con un processo produttivo a 8 nanometri che sembra essere stato uno dei principali motivi dei ritardi nella distribuzione delle schede video sul mercato, oltre chiaramente al Covid-19, e la causa principale della scarsità delle forniture per una resa produttiva inferiore di molto alle aspettative.

Sembra quindi che NVIDIA abbia deciso di fare il passo molto più lungo della gamba, lasciandosi alle spalle non solo gli 8 nanometri di Samsung, ma anche i 7 nanometri di TSMC, l'altra fonderia nota sul mercato, utilizzata da AMD per le sue più recenti schede video Radeon e per i processori Ryzen.

L'obiettivo della casa di Santa Clara è di puntare direttamente ai 5 nanometri, anche se al momento nessuno sembra conoscere il partner di NVIDIA, se continuerà cioè ad appoggiarsi a Samsung, oppure se punterà a TSMC opzionando l'esclusiva del processo produttivo così da sfruttare un produttore che si è dimostrato più affidabile e veloce e mettendo anche i bastoni tra le ruote ad AMD che si ritroverebbe senza il suo storico alleato per le future schede video basate su RDNA 3.

Come se questo non bastasse, sembra che NVIDIA abbia piazzato un ordine per la produzione di un quantitativo consistente di GPU con il processo produttivo a 6 nanometri. Una sorta di via di mezzo che le consenta di riprendersi al volo lo scettro della scheda video con processo produttivo più avanzato sul mercato. Il problema è che anche in questo caso non è ben chiaro se si tratti di una sorta di revisione di Ampere, magari la serie 3000 Super sulla falsariga di quanto fatto con la famiglia 2000, oppure se si tratti di un chip completamente inedito, magari relativo ad altre fasce di mercato.

Specifiche di Ada

Quello che invece viene dato ormai per sicuro è che Lovelace utilizzerà il processo a 5 nanometri e avrà specifiche semplicemente fantasmagoriche.

Il chip principale infatti, quello che si crede possa chiamarsi AD102, dovrebbe presentare un design interno basato su una struttura 12x6 in contrapposizione al design 7x6 che troviamo invece sul GA102 di Ampere, quello alla base della RTX 3080 e 3090. Il che si tradurrebbe in 12 Graphic Processing Cluster e 72 Texture Processing Cluster. Questi ultimi consentirebbero di avere 144 Streaming Multiprocessor per un totale di 18432 CUDA Core, poco meno del doppio dei CUDA Core del chip top di gamma di Ampere che si ferma a 10752. Ipotizzando una frequenza di lavoro di 1,8 GHz, si dovrebbero raggiungere i 66 TeraFLOPS massimi nei calcoli in virgola mobile a 32 bit, un salto in avanti che quasi doppia i 35 e rotti TeraFLOPS raggiunti dalla 3090.

Questi numeri sbalorditivi dovrebbero essere permessi proprio dal sostanzioso salto in avanti per quello che concerne il processo produttivo. Passare dagli 8 ai 5 nanometri vuol dire poter aumentare le dimensioni del chip, poter aumentare il numero di transistor per millimetro quadrato, avere minori consumi energetici e minore produzione di calore. E quindi poter lavorare su un aumento consistente dei cluster che compongono la GPU e magari anche ritoccare verso l'alto le frequenze di lavoro.

E tutto questo senza prendere in considerazione la cache di secondo livello che, anche in questo caso dando retta alle indiscrezioni, dovrebbe essere aumentata in modo sostanziale dopo essere rimasta bloccata per 2 generazioni di seguito. Tutto splendido splendente? A quanto pare sì, ma chiaramente rimane un interrogativo enorme.

Data di uscita

Quando arriveranno sul mercato le nuove schede video? E qui si apre letteralmente il totoscommesse visto che le variabili in gioco sono tantissime e, soprattutto, siamo ancora nel bel mezzo di una pandemia che ha letteralmente stravolto le tabelle di marcia di tutti i principali produttori di tecnologia.

Oggi dobbiamo ancora fare i conti con la ridottissima disponibilità di schede video della famiglia 3000. Ed è assai probabile che qualche modello manchi ancora all'appello: una 3050 per la fascia bassissima di mercato, la 3070 Ti e la 3080 Ti o, addirittura un refresh a distanza di un anno o meno, come fatto con la famiglia 2000 che potrebbe tornare a utilizzare il suffisso Super e potrebbe aumentare ulteriormente il rapporto tra prezzo e prestazioni magari attraverso il boost delle frequenze e l'aumento della RAM.

E inseriamo nel calderone anche il discorso della versione mobile delle 3000 che, a tutt'oggi, manca all'appello e che potrebbe diventare protagonista del CES di Las Vegas di gennaio.

Volendo fare delle ipotesi, ci sentiamo di dire che per tutto il 2021 NVIDIA continuerà a spremere l'architettura Ampere introducendo sul mercato da qui alla primavera le versioni mobile e gli ultimi modelli rimasti esclusi come le versioni Ti delle 3070 e 3080. Poi, sul finire dell'anno sarà la volta del refresh della lineup con i modelli Super che potrebbero anche compensare la disponibilità ridotta di tutti questi mesi.

E solo nel 2022, a cavallo dell'autunno, potremo finalmente vedere, secondo noi, i modelli 4000.

Hopper: l'architettura del futuro

Ma come vi dicevamo all'inizio del video, non siamo qui solo per parlarvi di Lovelace visto che le modifiche alla tabella di marcia di NVIDIA riguardano anche l'architettura successiva, quella che dovrebbe rivoluzionare in toto la struttura delle GPU della casa di Santa Clara e che soprattutto dovrebbe permettere un nuovo progresso nei decenni a venire.

Stiamo parlando di Hopper, la tecnologia che sembra essere stata spostata di qualche anno in avanti, proprio per consentire l'anticipo di Lovelace. Qui i dettagli sono scarsissimi e si focalizzano esclusivamente sulla portata di questa rivoluzione che, toccando il design interno del die, dovrebbe comportare un cambio radicale nella produzione delle schede video. Un cambio che in realtà AMD ha già abbracciato con successo con i suoi processori Ryzen e che dovrebbe essere parte integrante di RDNA 3.

Qui si rischia di scendere molto nel dettaglio. Per ora vi basti sapere che Hopper dovrebbe comportare il passaggio dal design monolitico attuale a quello MCM, multi-chip.

Per dirla nel modo più semplice possibile, ma non per forza nel modo più corretto, immaginate che oggi i chip alla base delle schede video NVIDIA siano disegnati come un sistema unico, chiuso: un singolo die di dimensioni sempre crescenti che contiene tutta l'architettura e tutti gli ingranaggi, se mi passate il termine, al suo interno. Quando il chip viene stampato sui wafer di silicio, al crescere della sua dimensione, cresce il rischio che non venga stampato correttamente e quindi risulti difettoso.

E, tra l'altro, più cresce il die, una cosa tipica del passaggio tra generazioni e architetture, e meno se ne possono stampare sul wafer. E quindi si rischia di buttarne sempre di più.

Il design MCM prevede invece che il chip venga spezzettato in tante parti molto più piccole che possono poi essere montate in serie, come per i processori, o in parallelo, come per le schede video, all'interno del SoC finale. Così facendo sullo stesso wafer si possono stampare molte più componenti, visto che sono più piccole, si rischia meno a prescindere dalla resa del sistema produttivo e soprattutto si può procedere virtualmente all'infinito con l'ingrandimento del die. Tanto, ciò che conta, è assemblare queste piccole parti in numeri via via crescenti.

Ecco, Hopper dovrebbe proprio rappresentare questo salto generazionale importantissimo che permetterebbe a NVIDIA di guardare al futuro con nuove architetture sempre più consistenti e di dimensioni maggiori, senza preoccuparsi troppo della resa produttiva.

Ah, giusto per completezza, Grace Hopper è stata un'altra donna pioniera dell'informatica e del computer. È stata una delle prime programmatrici dell'Harvard Mark 1, uno dei primissimi computer digitali elettromeccanici della storia, costruito durante la seconda guerra mondiale e fu una delle principali teoriche del concetto di linguaggio di programmazione indipendente dall'architettura che portò poi alla realizzazione del COBOL, un linguaggio utilizzato ancora oggi.

Tra l'altro non dimentichiamoci mai che NVIDIA possiede ormai da qualche mese Arm e, siamo convinti, prima o poi inizieranno a produrre CPU. Chissà che un'architettura unificata con processore e GPU sullo stesso SoC, non possa beneficiare proprio di un design MCM. Ma questa è un'altra storia e magari ne parleremo in un altro articolo.

Per ora rimaniamo focalizzati sulle prossime GeForce RTX 4000. Siete curiosi anche voi di scoprire quanto andranno forte queste schede video? Oppure pensate che la tecnologia stia procedendo a un ritmo eccessivo? E non riesca a essere sfruttata a dovere?
Fatecelo sapere qui sotto tra i commenti.

Hai notato errori?