Meta a présenté Audiobox - l'IA pour la génération de voix et d'effets sonores

Par: Bohdan Kaminskyi | 12.12.2023, 13:05
Meta a présenté Audiobox - l'IA pour la génération de voix et d'effets sonores
Meta

Meta a annoncé une nouvelle plateforme d'IA appelée Audiobox, qui vous permet de créer des voix et des effets sonores personnalisés à l'aide de commandes vocales.

Ce que nous savons

Audiobox est basé sur le développement précédent de Meta, Voicebox. Toutefois, selon les développeurs, cette nouveauté surpasse son prédécesseur en termes de qualité sonore et de fonctionnalité.

La principale différence d'Audiobox est sa capacité à générer mais aussi à éditer de l'audio. La plateforme peut créer des discours dans différentes langues, des effets sonores (klaxons de voitures, aboiements de chiens, coups de tonnerre) et des paysages sonores entiers.

Meta a intégré à Audiobox les moyens de contrôler le processus de génération, de sorte que le résultat souhaité puisse être ajusté aussi précisément que possible.

Pour éviter les abus, les développeurs ont intégré un système de filigrane numérique dans Audiobox. Tout fichier audio généré à l'aide de la plate-forme est automatiquement étiqueté, ce qui permet d'en retracer l'origine.

Selon les développeurs d'Audiobox, la vitesse de génération audio est 25 fois plus rapide que les modèles Meta AI précédents. Cela est possible grâce à l'utilisation d'algorithmes de traitement des données personnalisés pour chaque tâche spécifique.

L'une des limites de la technologie à ce jour reste le manque de données étiquetées de qualité pour entraîner le modèle d'IA. Par exemple, pour qu'Audiobox puisse imiter avec précision différentes races de chiens ou les accents des gens, il lui faut un ensemble approprié d'exemples. Au fur et à mesure que la base de données s'étoffera, les capacités de la plateforme ne feront que croître.

Source : Meta