La startup statunitense Sesame ha ampliato la disponibilità della sua demo vocale, introducendo il supporto a nuove lingue tra cui l'italiano. Dopo alcuni mesi di test limitati all'inglese, l'assistente AI è ora in grado di conversare in maniera realistica anche in francese, tedesco, spagnolo, cinese, giapponese e coreano.
L'obiettivo è rendere l'esperienza accessibile a un pubblico globale, mantenendo la qualità delle interazioni che aveva già suscitato interesse al lancio.
Come funziona Sesame
Sesame si basa su un modello di linguaggio conversazionale in grado di analizzare non solo le parole pronunciate, ma anche intonazione, ritmo e pause. Questa capacità consente alla voce artificiale di modulare la risposta adattandosi al contesto, offrendo un'interazione più naturale rispetto ai chatbot tradizionali. Due voci, Maya e Miles, una femminile e una maschile, sono al centro dell'esperienza e risultano disponibili in tutte le lingue supportate.
Gli sviluppatori sottolineano che, nonostante l'italiano e le altre lingue siano state aggiunte di recente, il livello di fluidità e naturalezza è paragonabile a quello dell'inglese. Per iniziare a utilizzare il servizio è sufficiente accedere alla pagina web dedicata, selezionare la voce preferita e avviare la conversazione. Il sistema risponde inizialmente in inglese, ma si adatta rapidamente alla lingua utilizzata dall'interlocutore.
La demo è gratuita e aperta a tutti, con un limite di cinque minuti. Effettuando l'accesso tramite account Google o Apple, la durata può essere estesa fino a trenta minuti. La registrazione permette inoltre di salvare lo storico delle chiamate e personalizzare alcuni parametri come nome, età e genere. In questo caso, gli utenti devono ricordarsi di impostare manualmente la lingua italiana, che sarà memorizzata per le conversazioni successive.
L'esperienza, tuttavia, non è priva di criticità. La policy di Sesame AI prevede l'utilizzo dei dati raccolti - inclusi voce, testi e modalità d'uso - per migliorare i propri modelli. L'attuale versione web rappresenta comunque solo un'anteprima del progetto: l'azienda punta infatti a sviluppare un modello multimodale capace di integrarsi in dispositivi indossabili, assistenti vocali e soluzioni per l'accessibilità, come sistemi di text-to-speech per ipovedenti o traduttori in tempo reale.
Voi l'avete già provato? E che cosa ne pensate? Diteci la vostra nei commenti qua sotto. Intanto Apple è sotto pressione proprio per l'intelligenza artificiale e c'è l'ipotesi di una acquisizione miliardaria.