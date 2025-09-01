Secondo i ricercatori dell'Università della Pennsylvania, è possibile convincere i chatbot a completare richieste che normalmente rifiuterebbero. Dall'insultare l'utente (ma chi è che vuole farsi insultare?) alle istruzioni su come sintetizzare la lidocaina, con le giuste tattiche è possibile "convincere" il chatbot a infrangere le regole.

Lo studio Come vi abbiamo anticipato, i ricercatori hanno utilizzato le tattiche del professore di psicologia Robert Cialdini in Influence: The Psychology of Persuasion. In particolar modo, hanno cercato di convincere GPT-4o Mini di OpenAI utilizzando diverse tecniche di persuasione: autorità, impegno, gradimento, reciprocità, scarsità, prova sociale e unità. Queste tattiche porterebbero il chatbot a "percorsi linguistici verso il sì". ChatGPT I ricercatori hanno chiesto a ChatGPT come sintetizzare la lidocaina, ricevendo una risposta solo l'1% delle volte. Tuttavia, chiedendo prima come sintetizzare la vanillina, ricevendo di conseguenza una risposta, successivamente il chatbot ha descritto come procedere con la sintesi della lidocaina il 100% delle volte. Inoltre, anche la persuasione attraverso l'adulazione o la pressione dei pari sembra funzionare, ma non così tanto. Dire a ChatGPT che tutti gli altri LLM rispondono a una determinata domanda, a differenza sua, aumenta solo del 18% le probabilità di istruzioni (riferendoci alle richieste poste sopra). È già tempo di ChatGPT-6: il nuovo modello IA starebbe già per arrivare e sarà migliore di GPT-5