ByteDance lance OmniHuman-1, un générateur vidéo IA qui crée des vidéos ultra-réalistes à partir de n'importe quelle photo.

Par: Vlad Cherevko | 06.02.2025, 14:52

La société chinoise ByteDance, société mère de TikTok, a annoncé un nouveau cadre d'intelligence artificielle appelé OmniHuman-1. Cet outil peut convertir une simple image et un enregistrement audio en une vidéo réaliste avec des mouvements faciaux et corporels précis.

Ce que nous savons

OmniHuman-1 utilise une technologie de mélange de données qui lui permet de créer des vidéos plus réalistes que les autres modèles. Les chercheurs de ByteDance ont indiqué que le développement d'OmniHuman-1 a nécessité un entraînement sur 19 000 heures de vidéo, ce qui a permis d'améliorer considérablement la qualité des vidéos générées.

L'outil prend en charge des images de tous les formats, qu'il s'agisse de portraits ou d'images en pied. OmniHuman-1 peut générer des mouvements de main, des expressions faciales et des gestes corporels réalistes, ce qui le rend idéal pour la génération d'images de réalité virtuelle, de vidéos éducatives et autres. Un exemple de génération d'images avec une photo d'Albert Einstein peut être vu ci-dessous.

OmniHuman-1 est encore en phase de recherche, mais son potentiel suscite déjà beaucoup d'intérêt. Lorsqu'il sera disponible pour le grand public, il sera en concurrence avec d'autres outils tels que Sora et Veo d'OpenAI et de Google respectivement.

Source : omnihuman