L'utilizzo di video di YouTube per addestrare modelli di intelligenza artificiale (IA) sta diventando un tema sempre più controverso. Dopo le critiche mosse a OpenAI, Meta e Google, ora anche Apple è finita nell'occhio del ciclone.

Secondo un recente report di Wired, terze parti avrebbero scaricato i video come file di sottotitoli, che sono stati poi utilizzati per addestrare i modelli LLM. L'indagine rivela che oltre 170.000 video sono stati utilizzati, inclusi contenuti di noti YouTuber come MKBHD, Jimmy Kimmel, PewDiePie e MrBeast.

Questo solleva importanti questioni riguardo al consenso e alle pratiche etiche nell'utilizzo dell'IA. Le aziende coinvolte hanno utilizzato i contenuti per i propri processi di addestramento, nonostante questa pratica di estrazione di materiale violi le regole di YouTube che vietano l'accesso automatizzato ai video e l'utilizzo indipendente degli stessi senza autorizzazione.

Un'organizzazione no-profit chiamata EleutherAI avrebbe inizialmente raccolto questi dati, denominati Pile, con lo scopo di utilizzarli per scopi educativi e di formazione per sviluppatori. Tuttavia, anche EleutherAI è stata coinvolta nella controversia per aver utilizzato il dataset senza il consenso dei creatori dei video.

Apple avrebbe utilizzato Pile per addestrare il suo modello OpenELM, lanciato ad aprile. Questa situazione mette in luce l'importanza di affrontare le questioni relative al consenso e alle pratiche etiche nell'ambito dell'intelligenza artificiale. L'utilizzo non autorizzato di contenuti protetti da copyright per addestrare modelli di IA solleva interrogativi sulle responsabilità delle aziende coinvolte e sull'impatto che queste pratiche possono avere sui creatori di contenuti.

"Un'inchiesta di Proof News - si legge nell'articolo di Wired - ha scoperto che alcune delle più ricche aziende di intelligenza artificiale al mondo hanno utilizzato materiale proveniente da migliaia di video di YouTube per addestrare l'IA. Le aziende lo hanno fatto nonostante le regole di YouTube vietino l'estrazione di materiale dalla piattaforma senza permesso. La nostra indagine ha rilevato che i sottotitoli di 173.536 video di YouTube, prelevati da oltre 48.000 canali, sono stati utilizzati dai colossi della Silicon Valley, tra cui Anthropic, Nvidia, Apple e Salesforce".

Al momento, Apple e le altre aziende coinvolte non hanno ancora rilasciato una dichiarazione ufficiale in merito alle preoccupazioni sollevate. Resta da vedere come i colossi del tech risponderanno a queste accuse e quali misure adotteranno per garantire un utilizzo etico e responsabile dei dati nell'ambito dell'intelligenza artificiale. E a proposito di problemi con l'IA, Microsoft ha nuovi guai con l'antitust UK: nel mirino ci sono le assunzioni per la divisione Microsoft AI.

E voi che cosa ne pensate di questa situazione? Credete che le aziende tecnologiche debbano ottenere il consenso dei creatori di contenuti prima di utilizzare i loro video per addestrare i modelli di IA? Diteci la vostra nei commenti qua sotto.