Lanciata da Harvard Law School Library, l'Institutional Data Initiative mira a trasformare collezioni storiche in dati per lo sviluppo dell'IA, con il supporto di Microsoft e OpenAI.

La Harvard Law School Library ha presentato l'Institutional Data Initiative (IDI), un progetto innovativo per pubblicare collezioni di dati provenienti da biblioteche, musei e agenzie governative. L'obiettivo è rendere questi dati accessibili per una vasta gamma di applicazioni, incluso l'addestramento di modelli di intelligenza artificiale. IDI inizierà con la digitalizzazione di un milione di libri di pubblico dominio della Harvard Library e collaborerà con la Boston Public Library per trasformare milioni di pagine di giornali storici in dataset utilizzabili.

Il supporto di Microsoft e OpenAI Microsoft e OpenAI hanno annunciato il loro sostegno all'iniziativa, sottolineando l'importanza di un accesso aperto ai dati. Burton Davis, Vicepresidente di Microsoft, ha evidenziato l'impegno dell'azienda nella creazione di un ecosistema IA inclusivo, ricordando la Open Data Campaign del 2020. Tom Rubin, responsabile della Proprietà Intellettuale per OpenAI, ha elogiato il progetto per il suo potenziale nel diffondere conoscenza e creatività, enfatizzando il ruolo cruciale delle istituzioni accademiche nella ricerca sull'IA. Il logo dell'IDI. L'IDI non si limita a collezioni testuali; l'iniziativa prevede di includere dati scientifici e biomedici attraverso partnership con altre istituzioni. Questa espansione offre opportunità per avanzamenti tecnologici in settori critici come la medicina e la ricerca ambientale. Rendendo disponibili dataset di alta qualità, l'IDI mira a ridurre il divario nei dati tra grandi aziende e organizzazioni più piccole, favorendo un'innovazione più equa e collaborativa.