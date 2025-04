Meta Llama 4

Scout è descritto come un modello compatto, progettato per operare efficientemente anche su una singola GPU Nvidia H100. Maverick, invece, si posiziona come un modello più potente, con prestazioni che, secondo Meta, lo rendono competitivo con le più recenti offerte di OpenAI e Google, come GPT-4o e Gemini 2.0 Flash. Parallelamente, Meta sta continuando l'addestramento di Llama 4 Behemoth, un modello di base ancora più performante che, nelle intenzioni dell'azienda, ambisce a diventare il punto di riferimento nel panorama dell'intelligenza artificiale a livello globale.

Meta Llama 4

Uno degli aspetti più interessanti di Llama 4 Scout è la sua ampia finestra di contesto, dichiarata da Meta pari a 10 milioni di token. Questa capacità di elaborare e ricordare una grande quantità di informazioni permetterebbe al modello di gestire conversazioni e compiti complessi con maggiore coerenza e pertinenza. Secondo le affermazioni di Meta, Llama 4 Scout supera in diversi benchmark i modelli concorrenti come Gemma 3 e Gemini 2.0 Flash-Lite di Google, oltre al modello open-source Mistral 3.1, pur mantenendo un'impronta computazionale contenuta, tale da poter essere eseguito su una singola GPU Nvidia H100.

Anche per quanto riguarda il modello Maverick, Meta rivendica prestazioni di alto livello, paragonabili a quelle di GPT-4o di OpenAI e Gemini 2.0 Flash di Google. L'azienda sottolinea come Maverick raggiunga risultati competitivi con DeepSeek-V3 in compiti di codifica e ragionamento, utilizzando una quantità inferiore di parametri attivi. Questo suggerisce un'architettura più efficiente e una migliore gestione delle risorse computazionali.

Il terzo modello annunciato, Llama 4 Behemoth, rappresenta l'apice della nuova famiglia. Con i suoi 288 miliardi di parametri attivi e un totale di 2 trilioni di parametri, Behemoth promette di spingere ulteriormente i limiti delle capacità dell'intelligenza artificiale generativa. Sebbene non sia ancora disponibile, Meta anticipa che questo modello sarà in grado di superare le prestazioni dei suoi principali concorrenti, citando specificamente GPT-4.5 e Claude Sonnet 3.7 in diversi benchmark scientifici e tecnici (STEM).

Una delle innovazioni chiave introdotte con Llama 4 è l'adozione di un'architettura "mixture of experts" (MoE). Questo approccio consente di ottimizzare l'utilizzo delle risorse computazionali, attivando solo le parti del modello necessarie per l'esecuzione di un determinato compito. Meta ha inoltre annunciato che intende approfondire i piani futuri per i suoi modelli e prodotti di intelligenza artificiale durante la conferenza LlamaCon, prevista per il 29 aprile.

Come per le versioni precedenti, Meta definisce la collezione Llama 4 come "open-source". Tuttavia, è importante notare che la licenza di Llama è stata oggetto di alcune critiche. In particolare, la Open Source Initiative ha espresso dubbi sulla sua piena conformità ai principi dell'open source, a causa di alcune restrizioni. Ad esempio, la licenza di Llama 4 richiede alle entità commerciali con oltre 700 milioni di utenti attivi mensili di richiedere un'autorizzazione specifica a Meta prima di poter utilizzare i suoi modelli.

