Google ha presentato Veo, il generatore video basato sull'IA per competere con Sora di OpenAI

Google non si è fatta attendere oltre: nella giornata di ieri ha annunciato Veo, un'IA text-to-image che si prepara a competere sullo stesso piano di Sora.

L'evento Google I/O di ieri ha dato spazio soprattutto alla presentazione dei più recenti progressi nella tecnologia alimentata dall'intelligenza artificiale.

Tra le novità di maggior rilievo presentate dal colosso di Mountain View spicca Veo: l'ultima e più avanzata tecnologia per la creazione di video basata sull'IA sviluppata da Sundar Pichai e il suo team.

Così, mentre OpenAI lunedì ha cercato di alzare l'asticella con la nuova versione del suo modello di linguaggio, GPT-4o, Google con tre mesi distanza ha risposto al lancio di Sora, entrando in competizione nel campo dei modelli avanzati text-to-image per la generazione di video ad alta definizione.

Nato per il cinema

Google ha dichiarato che i video prodotti con Veo saranno più coesi e dettagliati rispetto a quelli realizzati con altri strumenti simili.

Parte di questo vantaggio deriverà dalla capacità degli utenti di intervenire sul contenuto generato.
Sarà possibile estendere la durata dei video con un semplice clic, oltre a perfezionare i risultati ottenuti in precedenza.

L'azienda sostiene che Veo permetterà agli utenti di creare clip di alta qualità a 1080p che superano i 60 secondi di durata.
Si prevede che possa essere utilizzato, oltre che attraverso prompt di testo, riconoscendo immagini e video, dimostrando così la sua versatilità.

Veo è in grado di adottare una vasta gamma di stili cinematografici e comprendere il linguaggio naturale, il che significa che può interpretare una varietà di termini tecnici, come "time-lapse" e "riprese aeree di un paesaggio".

Il modello apprende e comprende il contenuto di un video, esegue un rendering di suono e immagini ad alta definizione e simula la fisica del mondo reale, provando a restituire un'esperienza coinvolgente e realistica.

Vedremo

Demis Hassabis, CEO di Google DeepMind, si è mostrato entusiasta delle possibilità di Veo di migliorare ulteriormente i video ottenuti attraverso l'utilizzo di prompt aggiuntivi.
Oltre a ciò, Google sta esplorando ulteriori funzionalità per consentire all'IA di produrre storyboard e scene più lunghe, ampliando così le possibilità creative del modello.

Tuttavia, la disponibilità di Veo sarà inizialmente limitata a creatori selezionati tramite un'anteprima privata all'interno di VideoFX.
Le iscrizioni alla lista d'attesa sono già aperte, ma Google ha avvertito che le adesioni sono limitate in base alle regioni.

Veo segna attualmente il punto più alto dell'evoluzione dei modelli di generazione video di Google.
Nel frattempo, OpenAI sta attivamente promuovendo Sora a Hollywood e prevede di renderlo disponibile al pubblico entro la fine dell'anno, direttamente in applicazioni di editing video come Adobe Premiere Pro.
Inoltre, è nei piani un'integrazione audio ad arricchire i video generati.

Con l'interesse sempre crescente per gli strumenti di generazione video, sia Veo che Sora cercano di sorprendere il pubblico.
Tuttavia, il vantaggio iniziale di OpenAI nel mercato potrebbe rendere la competizione più impegnativa per il progetto di Google.

Hai notato errori?