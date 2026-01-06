NVIDIA ha annunciato ufficialmente Rubin, la nuova piattaforma IA destinata a diventare il cuore dei data center di prossima generazione. Rubin rappresenta un salto tecnologico netto rispetto all'attuale architettura Blackwell, con un incremento fino a 5 volte delle prestazioni e una drastica riduzione dei costi di inferenza.
La piattaforma Rubin è composta da sei chip principali, tutti già rientrati dalle fonderie e attualmente in fase di validazione nei laboratori NVIDIA. Al centro dell'ecosistema troviamo la nuova Rubin GPU, un colosso da 336 miliardi di transistor progettato esclusivamente per carichi AI, affiancata dalla Vera CPU, basata su architettura Arm personalizzata Olympus, con ben 88 core e 176 thread.
Ulteriori dettagli tecnici su NVIDIA Rubin
Il cuore dei sistemi data center è il superchip NVIDIA Vera Rubin, che integra due GPU Rubin, una CPU Vera e grandi quantità di memoria HBM4 e LPDDR5X. La Rubin GPU offre fino a 50 PFLOPS in inferenza NVFP4 e 35 PFLOPS in training, con un miglioramento rispettivamente di 5x e 3,5x rispetto a Blackwell. La memoria HBM4 raggiunge una banda fino a 22 TB/s per chip, mentre NVLink 6 porta la larghezza di banda scale-up a 3,6 TB/s per GPU.
Grazie a 1,8 TB/s di interconnessione NVLink-C2C, fino a 1,5 TB di memoria di sistema e funzionalità avanzate di confidential computing a livello rack, la CPU diventa un elemento chiave per i carichi IA complessi e per le pipeline di inferenza su larga scala.
NVIDIA Rubin dal punto di vista del networking
Dal punto di vista del networking, NVLink 6, ConnectX-9 e BlueField-4 consentono una comunicazione estremamente efficiente tra nodi, con banda fino a 800 Gb/s e accelerazione in-network per operazioni collettive. La nuova piattaforma Spectrum-X Ethernet con ottiche co-packaged arriva a 102,4 Tb/s di capacità di switching, migliorando efficienza energetica, affidabilità e prestazioni applicative.
Tutte queste tecnologie convergono nel rack NVIDIA Vera Rubin NVL72, che offre fino a 3,6 EFLOPS in inferenza, 2,5 EFLOPS in training e un aumento significativo di capacità e banda di memoria rispetto a Blackwell.