OpenAI ha presentato Sora, un modello di intelligenza artificiale per la conversione di testi in video

Di: Bohdan Kaminskyi | 15.02.2024, 21:59

OpenAI

OpenAI ha annunciato un nuovo modello di generazione video chiamato Sora, in grado di creare video realistici e di fantasia della durata massima di un minuto a partire da una descrizione testuale.

Ecco cosa sappiamo

Secondo OpenAI, Sora crea scene complesse a più figure posizionando con precisione oggetti e personaggi nell'inquadratura. Il modello è anche in grado di generare diversi tipi di movimenti.

Gli sviluppatori hanno notato la capacità dell'IA di dettagliare sfondi, singoli oggetti e personaggi. Inoltre, è in grado di generare volti di personaggi con emozioni colorate e varie.

OpenAI sostiene che il suo modello ha una certa "comprensione" delle leggi fisiche del mondo reale. Tuttavia, a volte ci sono difficoltà nel creare scene complesse e relazioni di causa-effetto.

Oltre a sintetizzare video da zero, Sora è in grado di perfezionare ed estendere video esistenti. È in grado di riempire i fotogrammi mancanti in una sequenza di immagini.

Attualmente Sora è disponibile solo per i "red teamer" che valutano il modello per individuare potenziali danni e rischi. OpenAI ha anche aperto l'accesso ad alcuni artisti visivi, designer e registi per ottenere un feedback.

Fonte: OpenAI