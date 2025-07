Il modello è pensato per competere con rivali come ChatGPT, Gemini e Claude, in un momento che è però piuttosto delicato per il nuovo modello di xAI.

Le novità di Grok 4

Secondo xAI, Grok 4 mostra prestazioni di livello "frontier" su benchmark come "Humanity's Last Exam", dove ha superato i punteggi ottenuti da Google Gemini 2.5 Pro e OpenAI o3. La variante "Heavy" del modello, dotata di strumenti avanzati, avrebbe raggiunto un 44,4% di accuratezza, contro il 26,9% di Gemini. Sul test ARC-AGI-2 dell'organizzazione no-profit Arc Prize, Grok ha raggiunto un punteggio record di 16,2%, quasi il doppio rispetto a Claude Opus 4. Una delle innovazioni più rilevanti di Grok 4 Heavy è l'approccio "multi-agent", che consente a più istanze del modello di lavorare in parallelo sullo stesso problema, confrontando poi le risposte in modo collaborativo. "È come uno studio di gruppo tra intelligenze artificiali," ha detto Musk.

Con il lancio di SuperGrok Heavy, xAI introduce però anche l'abbonamento mensile più costoso tra i grandi operatori del settore. Gli abbonati avranno in cambio l'accesso prioritario a Grok 4 Heavy e ad altri prodotti in fase di sviluppo, tra cui un modello per la programmazione in arrivo ad agosto, un agente multimodale a settembre e una soluzione per la generazione video prevista per ottobre.

xAI ha anche annunciato che Grok 4 sarà disponibile via API, con l'obiettivo di incentivare sviluppatori e aziende a costruire applicazioni basate sul modello. Nonostante l'ottimismo sulle performance, xAI è una realtà giovane - la sua divisione enterprise ha solo due mesi - e dovrà lavorare per superare la percezione pubblica compromessa da recenti controversie.