OpenAI ha presentato Sora, un modello di intelligenza artificiale per la conversione di testi in video
OpenAI
OpenAI ha annunciato un nuovo modello di generazione video chiamato Sora, in grado di creare video realistici e di fantasia della durata massima di un minuto a partire da una descrizione testuale.
Ecco cosa sappiamo
Secondo OpenAI, Sora crea scene complesse a più figure posizionando con precisione oggetti e personaggi nell'inquadratura. Il modello è anche in grado di generare diversi tipi di movimenti.
Vi presentiamo Sora, il nostro modello text-to-video.
- OpenAI (@OpenAI) 15 febbraio 2024
Sora è in grado di creare video della durata massima di 60 secondi con scene altamente dettagliate, movimenti complessi della telecamera e personaggi multipli con emozioni vibranti. https://t.co/7j2JN27M3W
Prompt: "Bella, innevata... pic.twitter.com/ruTEWn87vf
Gli sviluppatori hanno notato la capacità dell'IA di dettagliare sfondi, singoli oggetti e personaggi. Inoltre, è in grado di generare volti di personaggi con emozioni colorate e varie.
Prompt: "Un trailer cinematografico con le avventure del trentenne spaziale che indossa un casco da motociclista in maglia di lana rossa, cielo blu, deserto di sale, stile cinematografico, girato su pellicola da 35 mm, colori vividi" pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15 febbraio 2024
Prompt: "Diversi mammut lanosi giganti si avvicinano camminando in un prato innevato, la loro lunga pelliccia lanosa soffia leggermente nel vento mentre camminano, alberi coperti di neve e drammatiche montagne innevate in lontananza, luce di metà pomeriggio con nuvole vaporose e un sole alto in lontananza... pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15 febbraio 2024
OpenAI sostiene che il suo modello ha una certa "comprensione" delle leggi fisiche del mondo reale. Tuttavia, a volte ci sono difficoltà nel creare scene complesse e relazioni di causa-effetto.
Oltre a sintetizzare video da zero, Sora è in grado di perfezionare ed estendere video esistenti. È in grado di riempire i fotogrammi mancanti in una sequenza di immagini.
Attualmente Sora è disponibile solo per i "red teamer" che valutano il modello per individuare potenziali danni e rischi. OpenAI ha anche aperto l'accesso ad alcuni artisti visivi, designer e registi per ottenere un feedback.
Fonte: OpenAI