Il meglio della tecnologia

Le caratteristiche di NVIDIA Blackwell

Riassumere tutte le novità portate in dote dalla nuova architettura NVIDIA Blackwell non è un esercizio semplice. Il "chip più potente al mondo", come lo ha definito lo stesso Huang è equipaggiato con 208 miliardi di transistor (104 per ogni die), prodotto sul nodo 4NP di TSMC appositamente customizzato per sviluppare un collegamento chip-to-chip da 10 TB/s in una singola GPU unificata.

Il Transformer Engine di seconda generazione, alimentato dal nuovo supporto di scalabilità micro-tensor e dagli algoritmi di gestione integrati nei framework NVIDIA TensorRT-LLM e NeMo Megatron, consente di raggiungere il doppio delle capacità di calcolo e un modello con nuove capacità di inferenza a 4 bit in virgola mobile.

NVLink di quinta generazione accelera invece le prestazioni per i modelli AI con una velocità di trasferimento bidirezionale di 1,8 TB/s per GPU, garantendo una comunicazione senza soluzione di continuità per i sistemi LLM più complessi.

RAS Engine rivoluziona il concetto di affidabilità e manutenzione: l'architettura Blackwell prevede una soluzione on-chip per sfruttare la manutenzione preventiva basata su AI, aumentando la stabilità e garantendo prestazioni di livello anche per i carichi di lavoro più duraturi nel tempo.

Secure AI fornisce il supporto per i nuovi protocolli di crittografia, fondamentali per i settori che devono garantire un alto livello di privacy.

Decompression Engine è infine un motore di decompressione dedicato che massimizza le prestazioni di analisi dei dati e data science.

I numeri di Blackwell

Rispetto alle GPU Hopper, NVIDIA Blackwell offre 128 miliardi di transistor in più, ben cinque volte le prestazioni IA che sono aumentate a 20 petaFlops in FP6 e quattro volte la densità di memoria per die. La GPU è affiancata da quella che è a tutti gli effetti la soluzione di memoria più veloce al mondo, con 8 TB/s su un'interfaccia bus a 8192-bit e fino a 192 GB di memoria HBM3e.

Le prime GPU Blackwell previste per il 2024 saranno la B100 e B200, destinate a varie soluzioni tra cui le piattaforme Superchip, con un totale di 160 SM per 20.480 core e un TDP rispettivamente di 700W di 1200W. NVIDIA si prepara a dettare legge sul mercato delle IA e non vediamo l'ora di scoprire le novità sulla prossima generazione di schede video dedicate al gaming.