Alcuni ricercatori studiano come i modelli di IA giocano ai videogiochi e, in alcuni casi, i risultati sono a dir poco esilaranti. Pare infatti che Gemini 2.5 Pro vada in panico quando i suoi Pokémon sono quasi vicini alla "morte". Vediamo tutti i dettagli in merito.
L’IA prova emozioni?
Secondo quanto riportato da Google DeepMind, Gemini 2.5 Pro va in panico quando i suoi Pokémon sono quasi KO. Ciò significa riscontrare un vero e proprio degrado a livello di ragionamento. Negli scorsi mesi due sviluppatori hanno condiviso degli stream su Twitch, ovvero "Gemini Plays Pokémon" e "Claude Plays Pokémon", mostrandone quindi i comportamenti in tempo reale e il processo di ragionamento dell'IA.
Attraverso questo sistema, viene analizzato il modo in cui l'IA valuta un problema, trovando poi una risposta e una soluzione. I risultati non sono dei migliori: Gemini impiega centinaia di ore per ragionare sul gioco e comportarsi di conseguenza. Ed è qui che entra in gioco il "panico".
Questo stato influisce negativamente sulle prestazioni dell'IA, che potrebbe improvvisamente smettere di utilizzare determinati strumenti, nonché prendere decisioni sbagliate e affrettate, proprio come farebbe un umano quando è accecato dal panico.
Gemini ha completato Pokémon Blu
Attraverso "Gemini Plays Pokémon" di Joel Z, abbiamo assistito a un traguardo: Gemini ha completato Pokémon Blu, un grande classico della saga. Per fare ciò, Gemini ha utilizzato un agent harness; si tratta di un sistema che offre informazioni legate al gioco, permettendo quindi di prendere decisioni.
Lo stesso discorso vale per Anthropic, che aveva testato Claude su Pokémon Rosso, ma è stato superato abbondantemente da Gemini. E a proposito di Gemini 2.5 Pro, il nuovo modello è stabile ed è disponibile anche per utenti free. Potete trovare tutti i dettagli nel nostro articolo dedicato. Inoltre, Gemini diventa il vostro assistente personale grazie a nuove funzionalità in arrivo.