7

ChatGPT ora "ragiona" prima di rispondere: ecco o1, l'ultimo modello di intelligenza artificiale di OpenAI

OpenAI lancia o1, un nuovo modello IA in grado di risolvere problemi complessi e fornire spiegazioni dettagliate; ma è più lento e costoso di GPT-4

NOTIZIA di Raffaele Staccini   —   13/09/2024
L'immagine di presentazione di OpenAI o1-preview

OpenAI ha pubblicato un nuovo modello di intelligenza artificiale chiamato o1, il primo di una serie di modelli "di ragionamento" progettati per rispondere a domande complesse in modo più rapido ed efficiente rispetto a un essere umano. Insieme a o1, è stata rilasciata anche una versione più piccola ed economica, o1-mini.

Per OpenAI, o1 rappresenta un passo avanti verso l'obiettivo a lungo termine di creare un'intelligenza artificiale simile a quella umana. In termini pratici, il modello è in grado di scrivere codice e risolvere problemi multi-step in modo più efficace rispetto ai modelli precedenti. Tuttavia, è anche più costoso e lento da utilizzare rispetto a GPT-4. OpenAI ha definito questa uscita di o1 come una "preview" per sottolineare il suo stato ancora iniziale di sviluppo.

L'accesso a o1-preview e o1-mini è disponibile da subito per gli utenti di ChatGPT Plus e Team, mentre gli utenti Enterprise ed Edu potranno accedervi dalla prossima settimana. OpenAI prevede di estendere l'accesso a o1-mini anche agli utenti gratuiti di ChatGPT, ma non ha ancora stabilito una data precisa. L'accesso per gli sviluppatori a o1 è piuttosto costoso: nell'API, o1-preview costa $15 per 1 milione di token di input e $60 per 1 milione di token di output, mentre GPT-4 costa $5 per 1 milione di token di input e $15 per 1 milione di token di output.

Il processo di addestramento di o1 è fondamentalmente diverso da quello dei suoi predecessori. OpenAI ha utilizzato un nuovo algoritmo di ottimizzazione e un nuovo set di dati di addestramento specificamente progettato per questo modello. Invece di imitare semplicemente i modelli dei dati di addestramento, o1 è stato addestrato a risolvere problemi in modo autonomo utilizzando una tecnica nota come apprendimento per rinforzo, che insegna al sistema attraverso premi e penalità. Inoltre, utilizza una "catena di pensiero" per elaborare le richieste, in modo simile a come gli esseri umani affrontano i problemi passo dopo passo.

Grazie a questa nuova metodologia di addestramento, OpenAI afferma che il modello dovrebbe essere più accurato e meno incline alle "allucinazioni", ovvero la generazione di risposte false o fuorvianti. Tuttavia, il problema delle allucinazioni non è stato completamente risolto.

I risultati raggiunti dai vari modelli di OpenAI
I risultati raggiunti dai vari modelli di OpenAI

La caratteristica principale che distingue o1 da GPT-4 è la sua capacità di affrontare problemi complessi, come la codifica e la matematica, in modo molto più efficace rispetto ai suoi predecessori, fornendo anche spiegazioni dettagliate del suo ragionamento. OpenAI ha testato o1 su problemi matematici complessi e ha ottenuto risultati significativamente migliori rispetto a GPT-4. In un esame di qualificazione per l'Olimpiade Internazionale di Matematica (IMO), GPT-4o ha risolto correttamente solo il 13% dei problemi, mentre il modello di ragionamento ha ottenuto un punteggio dell'83%. Le loro abilità di codifica sono state valutate in concorsi e hanno raggiunto l'89° percentile nelle competizioni Codeforces.

La versione migliorata di o1 si è classificata nel 49° percentile nell'Olimpiade Internazionale di Informatica del 2024, rispettando le regole della competizione.
La versione migliorata di o1 si è classificata nel 49° percentile nell'Olimpiade Internazionale di Informatica del 2024, rispettando le regole della competizione.

Tuttavia, o1 non è altrettanto capace di GPT-4 in molte altre aree. Non ha le stesse conoscenze fattuali sul mondo e non è in grado di navigare sul web o elaborare file e immagini. Nonostante ciò, l'azienda ritiene che o1 rappresenti una nuova classe di capacità e lo ha chiamato o1 per indicare "un ritorno al punto di partenza".

L'interfaccia di o1 è stata progettata per mostrare i passaggi del ragionamento mentre il modello elabora le richieste, creando l'illusione di un pensiero umano. Tuttavia, OpenAI sottolinea che il modello non sta effettivamente pensando e non è umano. L'interfaccia serve a mostrare come il modello dedichi più tempo all'elaborazione e all'approfondimento dei problemi.

Sebbene i modelli di linguaggio di grandi dimensioni non siano ancora particolarmente intelligenti, OpenAI vede un futuro in cui sistemi autonomi, o agenti, saranno in grado di prendere decisioni e agire per conto degli utenti. Per i ricercatori di intelligenza artificiale, lo sviluppo di capacità di ragionamento rappresenta un passo importante verso l'intelligenza a livello umano, con potenziali applicazioni rivoluzionarie in settori come la medicina e l'ingegneria.

Voi che cosa ne pensate? Ci stiamo avvicinando a un'intelligenza artificiale davvero intelligente? Diteci la vostra nei commenti qua sotto.