OpenAI ha presentato Sora, un modello di intelligenza artificiale per la conversione di testi in video
OpenAI
OpenAI ha annunciato un nuovo modello di generazione video chiamato Sora, in grado di creare video realistici e di fantasia della durata massima di un minuto a partire da una descrizione testuale.
Ecco cosa sappiamo
Secondo OpenAI, Sora crea scene complesse a più figure posizionando con precisione oggetti e personaggi nell'inquadratura. Il modello è anche in grado di generare diversi tipi di movimenti.
Gli sviluppatori hanno notato la capacità dell'IA di dettagliare sfondi, singoli oggetti e personaggi. Inoltre, è in grado di generare volti di personaggi con emozioni colorate e varie.
OpenAI sostiene che il suo modello ha una certa "comprensione" delle leggi fisiche del mondo reale. Tuttavia, a volte ci sono difficoltà nel creare scene complesse e relazioni di causa-effetto.
Oltre a sintetizzare video da zero, Sora è in grado di perfezionare ed estendere video esistenti. È in grado di riempire i fotogrammi mancanti in una sequenza di immagini.
Attualmente Sora è disponibile solo per i "red teamer" che valutano il modello per individuare potenziali danni e rischi. OpenAI ha anche aperto l'accesso ad alcuni artisti visivi, designer e registi per ottenere un feedback.
Fonte: OpenAI