Fugatto : NVIDIA dévoile un puissant outil de vidéo générative

Par: Anry Sergeev | 25.11.2024, 19:05

NVIDIA a présenté Fugatto (Foundational Generative Audio Transformer Opus 1), un modèle d'IA génératif universel capable de créer et de transformer de la musique, des voix et des sons à partir de textes ou de requêtes audio. La société a qualifié ce développement de "couteau suisse pour le son".


Vidéo : Démonstration de NVIDIA Fugatto

Ce que nous savons

Fugatto est unique en ce sens qu'il associe les capacités précédemment exécutées par des modèles distincts. Il est capable d'effectuer des tâches complexes telles que

  • Générer de la musique à partir d'un texte : Par exemple, le modèle peut créer une "composition mélancolique au piano avec un léger rythme de jazz".
  • Transformation du son : Vous pouvez changer l'instrument d'une chanson, par exemple transformer une guitare en violoncelle ou ajouter une batterie à une mélodie existante.
  • Modification de la voix : Le modèle peut ajuster le ton émotionnel de votre voix ou même changer ses accents.
  • L'une des particularités de Fugatto est sa capacité à synthétiser des sons qui n'existent pas encore. Par exemple, il peut créer un bruit unique qui conviendrait à un film ou à un jeu particulier.

Pourquoi c'est important

Le développement de NVIDIA établit de nouvelles normes pour l'IA générative dans le domaine de l'audio. Avec Fugatto, les professionnels de la création disposent d'un outil qui non seulement automatise les processus de routine, mais qui offre également des possibilités infinies de créativité. La capacité de Fugatto à s'adapter à de nombreux scénarios signifie qu'à l'avenir, le modèle pourrait trouver des applications dans des domaines où l'audio est crucial, de la publicité aux programmes éducatifs.

Cette technologie confirme également la tendance des modèles d'IA à devenir multitâches. Auparavant, des modèles distincts étaient nécessaires pour les différentes tâches, mais aujourd'hui, Fugatto démontre que les solutions multifonctionnelles sont non seulement possibles, mais aussi efficaces.

Qu'est-ce qui se cache derrière le mot Fugatto ?

Il vient évidemment du mot "fugue". Une fugue est une forme musicale et une technique de composition caractérisée par une structure polyphonique, où un ou plusieurs thèmes (mélodies) sont répétés et développés à différentes voix. Le terme est dérivé du mot latin fuga, qui signifie "courir" ou "s'échapper", ce qui reflète l'idée d'un thème "courant" d'une voix à l'autre. La fugue est devenue un genre central de la musique baroque, notamment grâce à des compositeurs comme Jean-Sébastien Bach, considéré comme l'un des plus grands maîtres du genre.

Le mot "fugatto" (italien : fugato) désigne une forme musicale polyphonique apparentée à la fugue. Le fugato trouve son origine dans les œuvres de style strict et englobe une technique d'imitation où un ou plusieurs thèmes sont répétés et développés à différentes voix.

Source : blogs.nvidia.com