NVIDIA ha creado una "navaja suiza para audio": un nuevo modelo de IA puede crear y editar cualquier audio basándose en señales textuales
Nvidia ha anunciado Fugatto, un innovador generador de audio con inteligencia artificial capaz de crear y editar música, voz y sonidos a partir de señales textuales.
Esto es lo que sabemos
El modelo Fugatto o Foundational Generative Audio Transformer Opus AI, descrito como una "navaja suiza para el sonido", es capaz de crear audio y modificar archivos existentes de música, voz y sonido basándose en órdenes textuales. Fugatto ha sido desarrollado por un equipo internacional de investigadores, mejorando sus capacidades multilingües y multiacento.
La herramienta puede modificar la voz añadiendo acentos o cambiando el tono, editar música aislando voces, añadiendo instrumentos o sustituyendo melodías. Nvidia afirma que Fugatto está entrenado con millones de muestras de audio y puede realizar una amplia gama de tareas sin necesidad de datos adicionales.
Sin embargo, la compañía no especifica cuándo o si la herramienta estará disponible para el público. Fugatto destaca entre otras herramientas de IA como Stability AI y OpenAI por su capacidad para crear sonidos completamente nuevos.
Fuente: NVIDIA