Nella serata di ieri si è verificata una massiccia interruzione di Google Cloud, provocando numerosi malfunzionamenti. Le segnalazioni si sono moltiplicate e riguardano diversi servizi, tra cui Spotify, Google Home, Twitch, Discord, Cloudfare e molte altre piattaforme. Pare che la problematica si sia risolta, ma cerchiamo di capire meglio cos'è successo.
La causa dell’interruzione
A causare il disservizio sarebbe stato un guasto ai sistemi IAM. Quest'ultimi sono strettamente legati alla gestione dell'accesso sicuro ai servizi cloud, di conseguenza sono state impattate ben 26 aree geografiche nei data center di Google, nonché i vari Cloud SQL, App Engine, BigQuery e Firestore. Solo negli Stati Uniti sono state registrate oltre 40.000 segnalazioni in poche ore, precisamente su Downdetector.
Molti utenti non sono riusciti ad accedere a Spotify, mentre altri hanno riscontrato errori anomali. Anche i dispositivi Google Home e Nest sono stati impattati dall'interruzione di Google Cloud. Altre segnalazioni riguardano Anthropic, Shopify e Snapchat, ma il guasto pare si sia verificato in particolare negli Stati Uniti. Ad ogni modo, i servizi dovrebbero essere stati ripristinati intorno alle 21:30.
"Diversi prodotti Google Cloud e Google Workspace hanno registrato un aumento degli errori 503 nelle richieste API esterne, con conseguente impatto sui clienti", si legge sul sito ufficiale. "Dalla nostra analisi iniziale, il problema si è verificato a causa di un aggiornamento automatico non valido nel nostro sistema di gestione delle API, causando il rifiuto delle richieste API esterne".
Per prevenire ulteriori disservizi, Google adotterà diverse misure, come impedire che la piattaforma di gestione delle API abbia problemi a causa di dati non validi o corrotti, nonché migliorare la gestione degli errori del sistema.
Non solo Google Cloud
Pochi giorni fa, molti utenti hanno riscontrato diversi problemi anche con ChatGPT di OpenAI, e in poche ore Downdetector ha registrato un grande numero di segnalazioni. Pare che la causa del disservizio derivasse dall'infrastruttura di backend, quindi sia le API che il servizio di chat hanno presentato delle anomalie. OpenAI ha prontamente confermato il problema e ha lavorato a una soluzione, aggiornando tempestivamente gli utenti.