Google ha sviluppato la rete neurale Imagen Video, che crea video sulla base di descrizioni testuali.

Di: Maksim Panasovskiy | 07.10.2022, 21:34

Probabilmente avrete sentito parlare molto di reti neurali in grado di creare immagini in base a descrizioni. L'azienda americana Google non ha solo deciso di stare al passo con le tendenze, ma si è spinta oltre.

Ecco cosa sappiamo

Google ha annunciato una rete neurale in grado di creare non foto, ma interi video a partire da descrizioni testuali. Il sistema dell'azienda americana si chiama Imagen Video. Può creare videoclip con una risoluzione di 1280 x 768 pixel. Anche se la durata non può essere definita lunga: fino a 5 secondi.

Imagen Video imita gli stili degli artisti e può creare figure tridimensionali che mantengono la loro forma durante la rotazione. Per addestrare la rete neurale, gli sviluppatori di Google hanno utilizzato diverse decine di milioni di immagini, video e descrizioni di testo.

I risultati sono disponibili sul sito web del progetto Imagen Video. Google si rifiuta di condividere il codice sorgente, sostenendo che la sua decisione è stata presa per evitare contenuti inappropriati.

Fonte: Ars Technica