Fugatto: NVIDIA представила потужний інструмент генеративного відео

Автор: Анрі Сергіїв | 25 листопада 2024, 19:05

NVIDIA представила Fugatto (Foundational Generative Audio Transformer Opus 1) — універсальну генеративну AI-модель, здатну створювати та трансформувати музику, голоси та звуки на основі текстових або аудіо-запитів. Сама компанія назвала розробку "швейцарським армійським ножем для звуку" (Swiss Army knife for sound).


Відео: демонстрація роботи NVIDIA Fugatto

Що відомо

Fugatto є унікальною тим, що об'єднує можливості, які раніше виконували окремі моделі. Вона здатна виконувати складні завдання, такі як:

  • Генерація музики за текстом: Наприклад, модель може створити "меланхолійну фортепіанну композицію з легким джазовим ритмом".
  • Трансформація звуку: Ви можете змінити інструмент у композиції, скажімо, перетворити гітару на віолончель або додати звук барабанів у наявну мелодію.
  • Модифікація голосу: Модель може налаштовувати емоційний тон голосу або навіть змінювати його акценти.
  • Особливістю Fugatto є здатність синтезувати звуки, які ще не існували. Наприклад, вона може створити унікальний шум, який буде доречним у конкретному фільмі або грі.

Чому це важливо

Розробка NVIDIA ставить нові стандарти для генеративного AI в аудіо. Завдяки Fugatto креативні професіонали отримують інструмент, який не тільки автоматизує рутинні процеси, а й надає безмежні можливості для творчості. Здатність Fugatto адаптуватися до багатьох сценаріїв означає, що в майбутньому модель може знайти застосування у сферах, де аудіо має вирішальне значення — від реклами до освітніх програм.

Ця технологія також підтверджує тренд переходу AI-моделей до багатозадачності. Якщо раніше для різних завдань потрібні були окремі моделі, то тепер Fugatto демонструє, що багатофункціональні рішення є не лише можливими, але й ефективними.

Що ховається за словом Fugatto

Очевидно, що воно походить від слова "фуга". Фуга — це музична форма і композиційна техніка, що характеризується поліфонічною структурою, де одна або кілька тем (мелодій) повторюються і розвиваються в різних голосах. Термін походить з латинського слова fuga, що означає «біг» або «втеча», що відображає ідею «перебігання» теми від одного голосу до іншого. Фуга стала центральним жанром у музиці епохи бароко, особливо завдяки композиторам, таким як Йоганн Себастьян Бах, який вважається одним із найбільших майстрів цього жанру.

Слово «фугатто» (італ. fugato) означає поліфонічну музичну форму, що є споріднена з фугою. Фугатто виникло у творах суворого стилю й охоплює техніку імітації, де одна або кілька тем повторюються і розвиваються в різних голосах.

Джерело: blogs.nvidia.com