Il panorama dei modelli e degli strumenti d'intelligenza artificiale continua ad evolversi, questa volta con l'introduzione ufficiale, sul mercato, di un modello di casa Google. L'azienda di Mountain View ha infatti reso disponibile Imagen 4, il suo modello di generazione di immagini a partire da prompt testuali.
Dopo mesi di attesa, sviluppatori, designer e creativi possono ora testare questa tecnologia avanzata sia tramite API Gemini (in anteprima a pagamento), sia su Google AI Studio, dove è possibile provarlo gratuitamente con un limite d'uso. Si tratta di uno strumento che arriverà in due versioni e che garantisce massima libertà espressiva a chi lo utilizza.
I dettagli delle due versioni
Come appena detto, Imagen 4, arriverà in due versioni.La versione standard di Imagen 4 è ideale per la maggior parte dei progetti creativi. Offre immagini ad alta qualità con notevoli miglioramenti rispetto al precedente Imagen 3, soprattutto nel rendering del testo, che ora risulta molto più leggibile e preciso. Il costo è di 0,04 dollari per immagine.
La versione Ultra, invece, è pensata per chi ha bisogno di un allineamento quasi perfetto tra prompt e immagine generata. È più costosa (0,06 dollari per immagine), ma garantisce risultati estremamente accurati. Si tratta di due versioni per diverse esigenze ma che comunque hanno un fine ultimo identico: offrire la possibilità di generare immagini dettagliata in maniera semplice ed intuitiva.
La reale forza di Imagen 4
Un grande punto di forza di Imagen 4 è la sua capacità di inserire testi chiari e dettagliati nelle immagini, una caratteristica fondamentale per il mondo dell'editoria, della pubblicità e dei contenuti per i social. Google ha mostrato anche alcuni esempi d'utilizzo, tra cui: un fumetto spaziale con scritte sulle console, una cartolina vintage di Kyoto, una coppia in cima a una montagna all'alba e uno scatto di moda su uno sfondo alieno.
Inoltre, Imagen 4 proteggerà l'autenticità delle immagini applicando una filigrana digitale invisibile all'occhio umano. L'IA, dunque, continua a sorprendere e Google è ancora una volta in prima linea: l'ultimo caso che riguarda Big G è quello relativo alle azioni programmate di Gemini su mobile.