Windows ML, basato su ONNX Runtime, diventa così lo stack ufficiale di inferenza AI di Windows , e grazie alla collaborazione con NVIDIA garantisce che ogni applicazione possa sfruttare appieno i Tensor Core delle GPU RTX. Questo significa che gli sviluppatori possono integrare funzionalità AI nei loro software con un livello di prestazioni mai visto prima , senza sacrificare la compatibilità o la facilità di distribuzione. NVIDIA ha anche annunciato che TensorRT per RTX sarà disponibile in versione SDK a partire da giugno, ampliando così ulteriormente l'accesso a questa tecnologia.

Nel corso del Microsoft Build 2025 e del Computex, NVIDIA ha presentato l'evoluzione degli AI PC , unendo le proprie tecnologie con l'infrastruttura di Windows 11 per creare un ecosistema sempre più potente e accessibile. Al centro dell'annuncio c'è il nuovo TensorRT per RTX, una versione ottimizzata della nota libreria di inferenza AI, ora completamente integrata in Windows ML . Questa sinergia consente prestazioni elevate e configurazioni semplificate: gli sviluppatori non dovranno più creare manualmente modelli per ogni GPU, poiché l'ottimizzazione sarà eseguita localmente al primo avvio dell'app. I vantaggi? Un pacchetto otto volte più leggero , compatibilità immediata con tutte le GPU RTX (dalla serie 20 in poi), e un incremento delle performance superiore al 50% rispetto a DirectML.

Per favorire lo sviluppo di nuove funzionalità, NVIDIA ha anche rilasciato un Plug-in Builder basato su ChatGPT , che consente la creazione di plug-in in modalità no-code o low-code. Bastano poche istruzioni in linguaggio naturale per generare un file JSON e uno script Python funzionante, pronto per essere integrato nell'assistente. I progetti possono poi essere condivisi su GitHub o nel canale Discord ufficiale di NVIDIA, dando vita a una community creativa e collaborativa. L'obiettivo è chiaro: rendere l'intelligenza artificiale personale, modulabile ed estensibile, perfetta per l'utente moderno che cerca efficienza senza sacrificare la semplicità.

Le prime integrazioni includono strumenti già pronti per Google Gemini (con web search), Discord, Twitch, Spotify, IFTTT e SignalRGB, offrendo un controllo completo non solo sul PC ma anche sull'ambiente circostante e sugli strumenti di produttività e svago.

Tra le novità più sorprendenti annunciate da NVIDIA c'è Project G-Assist, un assistente AI per PC integrato nell'app GeForce , pensato per offrire un'interfaccia semplice, vocale o testuale, per controllare il proprio sistema. Ma la vera innovazione è la sua espandibilità tramite plug-in, che permette agli utenti di costruire flussi di lavoro personalizzati e interattivi con pochi click.

NIM e Blueprints: AI preconfigurata e accessibile per tutti

Per completare l'ecosistema degli AI PC, NVIDIA ha presentato NIM (NVIDIA Inference Microservices), una raccolta di modelli AI preconfigurati e containerizzati, pensati per funzionare senza complicazioni su PC RTX e cloud. Ogni NIM contiene tutto il necessario per eseguire modelli generativi come quelli di linguaggio, visione artificiale o sintesi vocale, con prestazioni ottimizzate per TensorRT. Un esempio concreto? Il modello FLUX.1-schnell per generazione immagini, sviluppato da Black Forest Labs, è ora disponibile come NIM, così come la versione aggiornata di FLUX.1-dev, compatibile con le GPU RTX 40 e 50.

Insieme ai NIM arrivano anche i Blueprints, progetti open source che mostrano come usare questi modelli all'interno di flussi di lavoro reali. Questi includono interfacce grafiche intuitive e si rivolgono tanto a sviluppatori quanto a semplici appassionati, offrendo percorsi concreti per la creazione di agenti AI, assistenti creativi, strumenti di produttività e molto altro. Il Blueprint rilasciato ad aprile, 3D Guided Generative AI, consente ad esempio di controllare composizione e inquadrature di immagini generate tramite una scena 3D, unendo creatività e precisione in modo rivoluzionario.