Reddit ha deciso di alzare la voce contro i colossi dell'intelligenza artificiale che utilizzano i suoi dati senza permesso. Steve Huffman, amministratore delegato della piattaforma, ha dichiarato in un'intervista che Microsoft, Anthropic e Perplexity si stanno comportando come se tutti i contenuti su internet fossero gratuiti e a loro disposizione.

Reddit ha intensificato la sua lotta contro i crawler negli ultimi mesi, aggiornando il suo file robots.txt per bloccare quelli con cui non ha accordi e impedendo a motori di ricerca come Bing di mostrare i suoi risultati. Huffman ha sottolineato come Microsoft abbia utilizzato i dati di Reddit per addestrare la sua IA e riassumere i contenuti nei risultati di Bing senza chiedere il permesso; ha inoltre aggiunto che bloccare queste compagnie finora è stata "una rottura di pal**".

Steve Huffman, amministratore delegato di Reddit

Huffman ha indicato l'accordo recente tra OpenAI e Reddit, che permette a SearchGPT di mostrare i risultati di Reddit, come modello da replicare. Con questa richiesta di accordi di licenza, Reddit si unisce ad altri editori di media tradizionali che cercano di ottenere un pagamento per l'utilizzo dei loro contenuti nell'addestramento dell'IA generativa. L'accusa di Reddit, tra l'altro, arriva dopo un reportage che evidenziava come Apple e altre aziende avessero addestrato i propri modelli di intelligenza artificiale utilizzando video di YouTube senza autorizzazione.

La presa di posizione di Reddit evidenzia quindi un cambiamento nel panorama digitale, dove la raccolta e l'utilizzo dei dati non sono più scontati. Le piattaforme online stanno cercando di proteggere i propri contenuti e di ottenere un giusto compenso per il loro valore. Resta da vedere come reagiranno i giganti tech alle richieste di Reddit e se saranno disposti a negoziare accordi di licenza. Nel frattempo, la piattaforma continuerà a bloccare i crawler non autorizzati, difendendo i propri dati e il proprio modello di business.

Dopo la pubblicazione dell'articolo di The Verge, comunque, la portavoce di Anthropic, Jennifer Martinez, ha inviato la seguente dichiarazione: "Reddit è stato inserito nella nostra lista di blocco per il web crawling da metà maggio e da allora non abbiamo aggiunto alcun URL di Reddit al nostro crawler. Rispettiamo il file robots.txt, il segnale accettato dal settore per bloccare il web crawling". Microsoft, inveve, ha rifiutato di commentare, mentre Perplexity non avrebbe ancora risposto a una richiesta di commento dei giornalisti.

