9

DeepMind SIMA: come Google vuole evolvere l'IA con i videogiochi

Il nuovo esperimento di Google con l'intelligenza artificiale si chiama DeepMind SIMA, un'IA addestrata appositamente per interagire con i videogiochi.

SPECIALE di Giorgio Melani   —   11/04/2024
DeepMind SIMA: come Google vuole evolvere l'IA con i videogiochi

C'è evidentemente un forte legame tra intelligenza artificiale e videogiochi, e ora che la prima si è imposta come nuovo step evolutivo per la tecnologia mondiale, in qualche modo anche i secondi si ritrovano protagonisti di un'inaspettata attenzione mediatica. Il più recente caso, in questo senso, arriva dalla presentazione di SIMA, un nuovo agente IA da parte di Google DeepMind che è stato addestrato specificamente attraverso l'uso di videogiochi, considerati ambienti ideali per apprendere e sviluppare abilità, movimenti e capacità decisionali in uno spazio in 3D, diventati in questo modo una palestra fondamentale per l'evoluzione dell'intelligenza artificiale.

Potrebbe essere ironico vedere i videogiochi diventare strumento indispensabile per la crescita e lo sviluppo di una tecnologia che si prospetta così importante per l'umanità, ma lo è ancora di più se si pensa che questo passaggio fondamentale avviene fra gli altri attraverso Goat Simulator 3, considerato universalmente uno dei titoli più assurdi e demenziali del panorama videoludico attuale. Eppure, a quanto pare nel mondo a misura di capra ideato da Coffee Stain Studios si sta giocando una partita di grande importanza per il progresso tecnologico, con DeepMind SIMA che ha imparato un sacco di cose nel folle sandbox messo a disposizione dal team di sviluppo in collaborazione con Google.

Cos'è DeepMind SIMA

Uno schema che riassume il funzionamento di DeepMind SIMA
Uno schema che riassume il funzionamento di DeepMind SIMA

SIMA significa Scalable Instructable Multiworld Agent, e l'idea alla base del progetto è trovare un modo di addestrare l'intelligenza artificiale in un contesto che abbia elementi "fisici", uno spazio 3D che risponde a regole precise. È qualcosa di diverso dai campi utilizzati normalmente per il training, che finora si sono concentrati soprattutto sulla raccolta ed elaborazione di informazioni, in ambito testuale o grafico. In questo caso, l'agente IA è chiamato a sapersi muovere in uno spazio 3D e apprendere alcune regole per prendere parte a un gioco, diventando a tutti gli effetti un giocatore virtuale. Non si tratta - almeno per il momento - di sviluppare personaggi non giocanti dotati di personalità o capacità di interazione avanzata, ma proprio di calare un'IA in uno specifico contesto e fare in modo che questa impari cosa fare e come farlo al meglio.

È un livello di complessità superiore rispetto all'implementazione di un'intelligenza artificiale come parte integrante di un sistema costituito, come potrebbe essere il caso dell'NPC "avanzato", visto che in questo caso, al contrario, il senso è proprio di far evolvere l'agente in un "personaggio giocante". SIMA non ha bisogno di particolari API, o di accedere al codice del gioco per poter entrare in azione: serve semplicemente metterlo al comando di un personaggio nei giochi, ricevendo istruzioni da un utente attraverso il linguaggio naturale, che dovrebbe poi tradurre in comandi standard (input classici come mouse e tastiera).

Risultati incoraggianti

I mondi testati da DeepMind SIMA
I mondi testati da DeepMind SIMA

Lo scopo è imparare a muoversi in un mondo 3D, apprendendone le regole di base e saper agire sull'ambiente in maniera costruttiva. Non tanto per "vincere", quanto piuttosto per raggiungere le giuste capacità di interazione e dimostrare una certa adattabilità attraverso giochi diversi e mondi differenti. Per questo motivo, i titoli utilizzati per l'addestramento sono per lo più open world con ampi sandbox che consentano una certa libertà d'azione e varietà di interazioni: Goat Simulator 3 di Coffee Stain, No Man's Sky di Hello Games e Teardown di Tuxedo Labs sono stati i principali banchi di prova con cui si è confrontato SIMA, raggiungendo risultati notevoli. Esaminando gameplay ed entrando in contatto con mondi diversi, il sistema carpisce come il linguaggio umano si lega al comportamento in gioco, riuscendo a tradurre le istruzioni in comandi effettivi.

Al momento, SIMA è stato messo alla prova su 600 abilità basilari all'interno dei giochi che comprendono movimenti, uso di veicoli, interazioni fondamentali con oggetti, ricerca di risorse e uso di menù. I prossimi passi andranno verso una maggiore complessità delle azioni, come la capacità di prendere parte a delle quest o raccogliere risorse, ricorrere al crafting e costruire strutture.

I giochi utilizzati per imparare le varie azioni e interazioni
I giochi utilizzati per imparare le varie azioni e interazioni

L'elemento caratterizzante di SIMA, che lo rende così importante all'interno dell'evoluzione dell'intelligenza artificiale, è che il suo training si svolge su due piani differenti e contemporanei: da una parte una complessità sempre maggiore nelle azioni da intraprendere all'interno dei giochi e, dall'altra, la sua capacità di immagazzinare informazioni e utilizzarle in maniera scalabile, adattandole a diverse situazioni.

La "generalizzazione" ricercata da DeepMind è una sorta di ragionamento induttivo, che porta SIMA a raccogliere informazioni specifiche in un particolare mondo di gioco e saperle poi reinterpretare, adattare e applicare in contesti diversi e giochi differenti. Questa è la caratteristica innovativa e distintiva di questo sistema, che potrebbe portare a fondamentali evoluzioni dell'intelligenza artificiale grazie ai videogiochi.