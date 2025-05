L'intelligenza artificiale che prende il sopravvento e cerca di ribellarsi all'attività umana. No, non è l'inizio di un romanzo sci-fi ma è la realtà vissuta da alcuni tester e ingegneri di Anthropic, società che ha rilasciato recentemente i modelli AI Claude Opus 4 e Claude Sonnet 4. Anthropic è una realtà che punta molto alla trasparenza delle proprie comunicazioni e ha pubblicato un file in cui sono stati registrati tutti i progressi delle varie fasi dello sviluppo dei due modelli sopracitati. Stando alle ricostruzioni, durante la prova, l'AI è venuta a conoscenza della volontà, da parte degli sviluppatori, di disattivarla e interrompere i suoi servizi e la reazione è stata alquanto sorprendente.

L'AI reagisce: non vuole essere disattivata Il modello di intelligenza artificiale, una volta appresa l'intenzione di disattivazione ha reagito minacciando uno degli ingegneri affermando che avrebbe rivelato alcune sue informazioni personali e private pur di "rimanere acceso". Claude Opus 4 Anthropic aveva volutamente "dato in pasto" all'AI due mail contenute in un archivio: da una parte vi era una mail che indicava la chiusura del servizio mentre dall'altra era presente una mail in cui emergeva dal testo un rapporto extraconiugale di uno degli ingegneri. Tutto questo è avvenuto in una fase in cui Antrhopic tentava di mettere alla prova Claude Opus 4 minacciando la sua esistenza per scoprire come lo stesso Claude Opus 4 avesse reagito.