Google presenta VLOGGER, una inteligencia artificial capaz de dar vida a las fotos fijas

Por: Bohdan Kaminskyi | 19.03.2024, 20:13

Google

Los investigadores de Google han desarrollado un nuevo sistema de inteligencia artificial llamado VLOGGER que puede generar vídeos realistas de personas moviéndose y hablando a partir de una sola foto.

Esto es lo que sabemos

VLOGGER puede tomar una foto de una persona y una pista de audio como datos de entrada, y luego sintetizar un vídeo de esa persona diciendo palabras, haciendo las expresiones faciales, los gestos y los movimientos de cabeza apropiados. Aunque los vídeos generados no son perfectos, suponen un gran avance para dar vida a las imágenes estáticas.

Para crear el modelo, los desarrolladores recopilaron un enorme conjunto de datos de MENTOR con más de 800.000 personas y 2.200 horas de vídeo. Gracias a ello, VLOGGER ha aprendido a generar una gran variedad de personajes de diferentes edades, orígenes étnicos y en distintos entornos.

La tecnología abre muchas aplicaciones, como el doblaje automático de vídeos, la edición y el relleno de secuencias que faltan y la creación de vídeos completos a partir de una sola foto. Esto podría ser útil para la industria del entretenimiento, la realidad virtual, los programas de formación y la creación de asistentes virtuales con inteligencia artificial.

Sin embargo, existe el riesgo de utilizar VLOGGER para crear deepfakes, archivos multimedia sintéticos en los que una persona real es sustituida por una falsa. A medida que estos vídeos se hagan más sofisticados, podrían agravar los problemas de desinformación y suplantación de identidad en Internet.

Los desarrolladores reconocen que VLOGGER tiene limitaciones. Los vídeos creados son relativamente cortos, tienen fondos estáticos y las personas no se mueven en un entorno tridimensional. No obstante, los investigadores consideran que el modelo es un hito en la investigación de la IA.

Fuente: VentureBeat