Gli esperti smontano la “campagna hacker autonoma al 90%” rivendicata da Anthropic

Il caso della presunta operazione cyber cinese alimentata da Claude accende il dibattito, ma gli analisti parlano di risultati molto meno rivoluzionari.

Anthropic ha dichiarato di aver individuato la prima operazione di cyber spionaggio quasi completamente orchestrata da un'IA, attribuita a un gruppo cinese che avrebbe impiegato Claude Code per automatizzare fino al 90 per cento delle attività. Il racconto è quello di un attacco gestito in autonomia per giorni, con interventi umani minimi. Tuttavia, la community di ricerca reagisce con molta più cautela e contesta sia la portata dell'automazione sia il reale impatto operativo visto sul campo.

I ricercatori chiedono prove e ricordano i limiti dell’IA

Uno dei punti critici sollevati dagli analisti riguarda l'apparente divario tra ciò che Anthropic sostiene e ciò che gli strumenti IA riescono a fare quando vengono usati da professionisti "white-hat". Come ha dichiarato Dan Tentler, noto esperto di sicurezza, se i modelli faticano a fornire risposte coerenti in contesti legittimi, risulta difficile credere che diventino improvvisamente super efficienti nelle mani degli attaccanti. Le evidenze raccolte finora mostrano vantaggi nelle fasi di triage e automazione di task ripetitivi, ma non un balzo evolutivo nella capacità degli attacchi.

Anthropic punta a 70 miliardi di dollari di ricavi entro il 2028

Il gruppo identificato come GTG-1002 avrebbe preso di mira una trentina di organizzazioni, tra aziende tecnologiche e agenzie governative. Solo una parte molto ridotta dei tentativi sarebbe però andata a segno, un dato che ridimensiona in modo sostanziale la narrazione di un attacco "ad alta autonomia". Gli stessi ricercatori si chiedono se il tasso di successo sarebbe stato superiore con tecniche più tradizionali e meno dipendenti da un modello che, secondo Anthropic stessa, ha spesso sovrastimato risultati e persino inventato credenziali inesistenti.

Un “agente autonomo” che usa strumenti vecchi e rilevabili

Oltre alle imprecisioni dell'IA, anche le tecniche impiegate sembrano tutt'altro che nuove. Gli attacchi avrebbero fatto uso di tool open source ampiamente noti e facilmente rilevabili dai difensori. La struttura in cinque fasi descritta da Anthropic evidenzia un tentativo di orchestrazione autonoma, ma non introduce innovazioni paragonabili a un salto di generazione. Per molti ricercatori, si tratta più di un'evoluzione incrementale degli script e framework usati da anni nel settore.

Il caso solleva comunque un punto reale: gli attaccanti stanno sperimentando l'uso di IA agentiche per scalare operazioni complesse e ridurre il carico umano. Tuttavia, le prove fornite non supportano la narrazione di un attacco "quasi completamente autonomo". Il quadro che emerge è quello di un esperimento in fase embrionale, afflitto da limiti tecnici significativi e da un impatto operativo modesto. Finché i modelli continueranno a mostrare allucinazioni, incoerenze e problemi di affidabilità, l'idea di attacchi realmente autonomi rimane più uno scenario teorico che una minaccia immediatamente concreta.

Hai notato errori?