OpenAI har avduket Sora, en AI-modell for konvertering av tekst til video.
OpenAI
OpenAI har lansert en ny videogenereringsmodell kalt Sora, som kan lage realistiske og fantasifulle videoer på opptil ett minutt ut fra en tekstbeskrivelse.
Dette er hva vi vet
Ifølge OpenAI skaper Sora komplekse scener med flere figurer ved å plassere objekter og figurer nøyaktig i bildet. Modellen er også i stand til å generere ulike typer bevegelser.
Utviklerne fremhever AI-ens evne til å detaljere bakgrunner, enkeltobjekter og karakterer. Dessuten kan den generere ansikter med fargerike og varierte følelser.
OpenAI hevder at modellen deres har en viss "forståelse" av de fysiske lovene i den virkelige verden. Noen ganger er det imidlertid vanskelig å skape komplekse scener og årsakssammenhenger.
I tillegg til å syntetisere videoer fra bunnen av, kan Sora forbedre og utvide eksisterende videoer. Det er i stand til å fylle inn manglende bilder i en bildesekvens.
Sora er foreløpig bare tilgjengelig for "red teamers" som evaluerer modellen for potensielle skader og risikoer. OpenAI har også gitt tilgang til noen billedkunstnere, designere og filmskapere for å få tilbakemeldinger.
Kilde: OpenAI