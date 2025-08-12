Reddit ha annunciato che limiterà drasticamente l'accesso dell'Internet Archive alla propria piattaforma, impedendo alla Wayback Machine di indicizzare la maggior parte dei contenuti. La misura, che entra in vigore progressivamente da oggi, consentirà l'archiviazione soltanto della homepage di Reddit, escludendo pagine dettagliate dei post, commenti e profili utente. In pratica, il servizio potrà registrare solo una panoramica giornaliera dei titoli e dei post più popolari, senza più conservare lo storico delle discussioni.

Accuse di scraping da parte di aziende AI Secondo il portavoce Tim Rathschmidt, la decisione nasce dalla scoperta che alcune aziende di intelligenza artificiale avrebbero sfruttato la Wayback Machine per aggirare le restrizioni di Reddit e raccogliere dati in violazione delle policy della piattaforma. Reddit sostiene che l'Internet Archive, pur fornendo un servizio utile al web, non garantisca la protezione dei dati e il rispetto della privacy, ad esempio eliminando i contenuti rimossi. Fino a quando l'organizzazione non adotterà misure adeguate, l'accesso rimarrà limitato. Reddit punta a diventare un vero motore di ricerca Negli ultimi anni Reddit ha adottato una strategia sempre più rigida verso lo scraping non autorizzato, in particolare da parte di società che usano i contenuti per addestrare modelli AI. Nel 2024 la piattaforma ha siglato accordi commerciali con Google e OpenAI per fornire dati a pagamento, bloccando allo stesso tempo i motori di ricerca e le API a chi non sottoscrive un'intesa economica. Nel giugno di quest'anno Reddit ha anche avviato un'azione legale contro Anthropic, accusandola di continuare a raccogliere dati nonostante le rassicurazioni contrarie.