Meta presenta Audiobox - IA para generación de voz y efectos de sonido
Meta
Meta ha anunciado una nueva plataforma de IA llamada Audiobox, que permite crear voces y efectos de sonido personalizados mediante comandos de voz.
Esto es lo que sabemos
Audiobox se basa en el desarrollo anterior de Meta, Voicebox. Sin embargo, según los desarrolladores, la novedad supera a su predecesora en calidad de sonido y funcionalidad.
A partir de hoy puedes probar nuestro nuevo modelo básico de investigación para la generación de audio. La demo incluye Zero shot TTS, Text to sound effects, Infilling y mucho más!
- AI at Meta (@AIatMeta) 11 de diciembre de 2023
Prueba Audiobox ➡️ https://t.co/8OPcJYy8a9 pic.twitter.com/lo9rCOZMAh
La principal diferencia de Audiobox es la capacidad no solo de generar, sino también de editar audio. La plataforma puede crear habla en diferentes idiomas, efectos de sonido (bocinas de coches, ladridos de perros, truenos) y paisajes sonoros completos.
Meta ha incorporado en Audiobox los medios de control sobre el proceso de generación, para que el resultado deseado pueda ajustarse con la mayor precisión posible.
Para evitar abusos, los desarrolladores han integrado en Audiobox un sistema de marca de agua digital. Cualquier audio generado con la plataforma se etiqueta automáticamente para poder rastrear su origen.
Según los desarrolladores de Audiobox, la velocidad de generación de audio es 25 veces superior a la de anteriores modelos de Meta AI. Esto es posible gracias al uso de algoritmos de procesamiento de datos personalizados para cada tarea específica.
Una limitación de la tecnología hasta ahora sigue siendo la falta de datos etiquetados de calidad para entrenar el modelo de IA. Por ejemplo, para que Audiobox imite con precisión distintas razas de perros o el acento de las personas, necesita un conjunto adecuado de ejemplos. A medida que se amplíe la base de datos, aumentarán las posibilidades de la plataforma.
Fuente: Meta