Meta presenta Audiobox - IA para generación de voz y efectos de sonido

Por: Bohdan Kaminskyi | 12.12.2023, 14:03

Meta

Meta ha anunciado una nueva plataforma de IA llamada Audiobox, que permite crear voces y efectos de sonido personalizados mediante comandos de voz.

Esto es lo que sabemos

Audiobox se basa en el desarrollo anterior de Meta, Voicebox. Sin embargo, según los desarrolladores, la novedad supera a su predecesora en calidad de sonido y funcionalidad.

La principal diferencia de Audiobox es la capacidad no solo de generar, sino también de editar audio. La plataforma puede crear habla en diferentes idiomas, efectos de sonido (bocinas de coches, ladridos de perros, truenos) y paisajes sonoros completos.

Meta ha incorporado en Audiobox los medios de control sobre el proceso de generación, para que el resultado deseado pueda ajustarse con la mayor precisión posible.

Para evitar abusos, los desarrolladores han integrado en Audiobox un sistema de marca de agua digital. Cualquier audio generado con la plataforma se etiqueta automáticamente para poder rastrear su origen.

Según los desarrolladores de Audiobox, la velocidad de generación de audio es 25 veces superior a la de anteriores modelos de Meta AI. Esto es posible gracias al uso de algoritmos de procesamiento de datos personalizados para cada tarea específica.

Una limitación de la tecnología hasta ahora sigue siendo la falta de datos etiquetados de calidad para entrenar el modelo de IA. Por ejemplo, para que Audiobox imite con precisión distintas razas de perros o el acento de las personas, necesita un conjunto adecuado de ejemplos. A medida que se amplíe la base de datos, aumentarán las posibilidades de la plataforma.

Fuente: Meta