xAI, la società di intelligenza artificiale di Elon Musk, ha recentemente potenziato il suo modello Grok aggiungendo la capacità di comprendere le immagini. Grazie a questa nuova funzione, gli utenti paganti della piattaforma social X, che hanno accesso al chatbot Grok, possono ora caricare un'immagine e fare domande all'IA sul contenuto visivo. Si tratta di un significativo passo avanti per l'azienda, che mira a rendere l'interazione con l'IA più completa e intuitiva.
L'annuncio
Un dipendente di xAI e l'account ufficiale @grok hanno comunicato questa novità su X nella giornata di lunedì. Musk stesso ha pubblicato un post in cui specifica che Grok è persino in grado di spiegare il significato di una battuta utilizzando questa nuova capacità di comprensione delle immagini. Musk ha però sottolineato che la funzione è ancora in fase iniziale, ma prevede un miglioramento rapido nelle prossime versioni.
Questa nuova capacità di Grok arriva dopo il lancio di Grok-2, una versione migliorata del chatbot presentata ad agosto. Grok-2 ha integrato funzionalità di generazione d'immagini grazie al modello FLUX.1 di Black Forest Labs, rendendo il chatbot uno strumento più completo e creativo. Anche Grok-2 era inizialmente disponibile solo per sviluppatori e utenti paganti di X.
Le novità in arrivo
Secondo xAI, una versione futura del modello integrerà la comprensione multimodale sia su X che tramite l'API offerta agli sviluppatori. Questo significa che il chatbot sarà in grado di interpretare non solo immagini, ma anche altre modalità di input, come documenti e contenuti testuali complessi. In risposta a un utente che criticava la mancanza di supporto per file PDF e altri formati, Musk ha dichiarato che "non sarà per molto" e che xAI sta procedendo a un ritmo tale da realizzare in pochi mesi ciò che altri hanno impiegato anni a sviluppare.
Questa spinta all'innovazione è parte del piano di Musk per rendere più attraenti i servizi a pagamento della piattaforma X. Ad esempio, questo mese X ha lanciato Radar, uno strumento esclusivo per gli abbonati Premium+ che consente di monitorare le tendenze in tempo reale e ottenere informazioni dettagliate sulle conversazioni in corso sulla piattaforma. La combinazione di queste nuove funzionalità - Radar e le capacità avanzate di Grok - punta a rendere l'offerta di X sempre più competitiva, offrendo agli utenti paganti strumenti di intelligenza artificiale e analisi avanzati.