NVIDIA ha creado una "navaja suiza para audio": un nuevo modelo de IA puede crear y editar cualquier audio basándose en señales textuales

Por: Vlad Cherevko | 26.11.2024, 13:50

Nvidia ha anunciado Fugatto, un innovador generador de audio con inteligencia artificial capaz de crear y editar música, voz y sonidos a partir de señales textuales.

Esto es lo que sabemos

El modelo Fugatto o Foundational Generative Audio Transformer Opus AI, descrito como una "navaja suiza para el sonido", es capaz de crear audio y modificar archivos existentes de música, voz y sonido basándose en órdenes textuales. Fugatto ha sido desarrollado por un equipo internacional de investigadores, mejorando sus capacidades multilingües y multiacento.

La herramienta puede modificar la voz añadiendo acentos o cambiando el tono, editar música aislando voces, añadiendo instrumentos o sustituyendo melodías. Nvidia afirma que Fugatto está entrenado con millones de muestras de audio y puede realizar una amplia gama de tareas sin necesidad de datos adicionales.

Sin embargo, la compañía no especifica cuándo o si la herramienta estará disponible para el público. Fugatto destaca entre otras herramientas de IA como Stability AI y OpenAI por su capacidad para crear sonidos completamente nuevos.

Fuente: NVIDIA

Inteligencia artificial