Meta sostiene che la condivisione dei libri pirata tramite BitTorrent per addestrare l'IA sia "corretto"

Meta sostiene in tribunale che la condivisione automatica di libri pirata tramite BitTorrent sia "fair use", poiché necessaria per ottenere dataset usati per addestrare l'IA.

La corsa allo sviluppo dei modelli di intelligenza artificiale ha sollevato numerose questioni legali legate al copyright. Tra i casi più discussi c'è quello che coinvolge Meta Platforms, accusata da diversi autori di aver utilizzato libri pirata per addestrare i propri modelli di linguaggio.

Nel 2023 alcuni autori noti, tra cui Richard Kadrey, Sarah Silverman e Christopher Golden, hanno avviato una class action contro l'azienda. Secondo l'accusa, Meta avrebbe scaricato e condiviso milioni di libri protetti da copyright tramite reti BitTorrent provenienti da archivi non ufficiali come Anna's Archive.

Meta e la questione del "fair use"

Nel corso del 2024, Meta ha ottenuto una prima importante vittoria legale. Il tribunale ha stabilito che l'uso dei libri pirata per addestrare il modello linguistico Llama poteva rientrare nel principio di fair use, poiché si trattava di un utilizzo trasformativo dei contenuti. Tuttavia, rimaneva aperta un'accusa significativa: la distribuzione diretta dei file tramite BitTorrent.

Meta introduce il Copyright Check per i Reels su Facebook: cosa significa e cosa cambia per gli utenti

Quando si scaricano file attraverso il protocollo BitTorrent, infatti, il sistema condivide automaticamente parti dei file con altri utenti della rete. Gli autori sostengono che questo processo equivalga a una violazione diretta del copyright. Recentemente Meta ha presentato una nuova linea difensiva davanti al tribunale federale della California.

L'azienda sostiene che anche l'upload automatico dei libri durante il download tramite BitTorrent debba essere considerato fair use. Secondo la società, questa condivisione non rappresenta una scelta volontaria ma una caratteristica intrinseca della tecnologia utilizzata per ottenere i dataset.

Meta e la posizione relativa a BitTorrent

Meta ha inoltre dichiarato che il protocollo BitTorrent era spesso l'unico modo pratico per scaricare grandi raccolte di libri da archivi come Anna's Archive. Di conseguenza, la condivisione dei file sarebbe stata parte integrante del processo necessario per ottenere i dati destinati all'addestramento dei modelli di intelligenza artificiale.

Gli avvocati degli autori contestano però questa strategia legale, sostenendo che Meta abbia introdotto la difesa del fair use troppo tardi nel procedimento. Dall'altra parte, l'azienda afferma di aver già menzionato questa possibilità in documenti precedenti del processo.

Meta sottolinea inoltre che gli stessi autori hanno dichiarato di non essere a conoscenza di casi in cui i modelli AI abbiano riprodotto direttamente contenuti dei loro libri. Secondo l'azienda, questo indebolirebbe l'argomento del danno economico.