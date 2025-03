Gemma 3 è disponibile in quattro dimensioni, con un numero di parametri che varia da 1 miliardo a 27 miliardi, e può essere utilizzato in due versioni principali: modelli pre-addestrati e modelli istruiti per specifici compiti. La versione da 1 miliardo di parametri è la prima della famiglia Gemma ad essere così leggera, rendendola adatta a dispositivi con capacità di calcolo ridotte.

Le novità di Google Gemma 3

Una delle novità più importanti è l'integrazione della multimodalità, che consente a Gemma 3 di elaborare non solo testo, ma anche immagini e video brevi. Questa caratteristica è resa possibile dall'encoder SigLIP, che traduce i contenuti visivi in rappresentazioni interne comprensibili dal modello. Grazie alla multimodalità, Gemma 3 può analizzare immagini, identificare oggetti, rispondere a domande basate sul contenuto visivo e persino leggere e interpretare il testo presente nelle immagini.

Gemma 3 è in grado di gestire contesti più ampi rispetto alle versioni precedenti, fino a 128.000 token in un'unica sessione. Questo significa che il modello può mantenere la coerenza su testi più lunghi, migliorando la sua capacità di analisi e comprensione in conversazioni estese o documenti complessi. Il supporto linguistico è stato ampliato notevolmente, passando dalle 80 lingue supportate da Gemma 2 a oltre 140 lingue in Gemma 3. Questa espansione è accompagnata dall'adozione di un nuovo tokenizer derivato da quello di Gemini 2.0, che permette al modello di gestire in modo più accurato le strutture linguistiche non inglesi e migliorare la qualità delle traduzioni.

Gemma 3 introduce anche ottimizzazioni specifiche per il problem solving e il coding, ma non è un modello "reasoning", cioè a catena di pensiero. I miglioramenti sono il risultato di una strategia di addestramento avanzata basata sul reinforcement learning. Il modello è stato inoltre migliorato utilizzando tecniche di distillazione e apprendimento con feedback umano e non.

Il grafico classifica i modelli di intelligenza artificiale in base ai punteggi Elo di Chatbot Arena; punteggi più alti (numeri in alto) indicano una maggiore preferenza degli utenti. Gemma 3 27B si classifica in alto, richiedendo una sola GPU, mentre altri ne richiedono fino a 32.

Google ha anche reso disponibili versioni quantizzate di Gemma 3, che riducono il consumo di memoria senza compromettere la qualità delle risposte. Questa caratteristica consente al modello di essere eseguito anche su hardware meno potenti, come singole GPU o TPU, rendendolo accessibile a un pubblico più ampio.

Oltre agli avanzamenti tecnici, Gemma 3 introduce anche strumenti per una maggiore sicurezza e affidabilità. Insieme al modello principale, Google ha lanciato parallelamente ShieldGemma 2, un sistema di controllo delle immagini basato su Gemma 3 da 4 miliardi di parametri. Questo strumento è pensato per moderare contenuti visivi, identificando e filtrando immagini potenzialmente pericolose, violente o inadatte.

I nuovi modelli Gemma 3 sono compatibili con numerosi framework open-source come Hugging Face, Ollama e JAX, permettendo agli sviluppatori di integrarli facilmente nei loro progetti. Gli "utenti comuni" più curiosi possono invece provare Gemma 3 27B attraverso Google AI Studio.

Voi che cosa ne pensate delle novità? Diteci la vostra nei commenti. Intanto l'aggiornamento di Google Messaggi risolve finalmente i problemi con foto e video RCS.