Meta hat den KI-Sound- und Songgenerator von AudioCraft veröffentlicht und seinen Quellcode freigegeben

Von Bohdan Kaminskyi | 03.08.2023, 11:59
Meta hat den KI-Sound- und Songgenerator von AudioCraft veröffentlicht und seinen Quellcode freigegeben

Meta hat AudioCraft veröffentlicht, ein quelloffenes KI-Tool, das Musik und Geräusche aus textlichen Hinweisen erzeugt.

Was bekannt ist

AudioCraft besteht aus drei KI-Modellen, die jeweils unterschiedliche Probleme bei der Klangerzeugung lösen:

  • MusicGen erzeugt Musik. Es wurde auf 20.000 Stunden Musik trainiert, die Meta gehört oder speziell für diesen Zweck lizenziert wurde;
  • AudioGen erzeugt Geräusche, indem es bellende Hunde oder Schritte imitiert. Das Modell wurde anhand von Aufnahmen trainiert, die an öffentlichen Orten gesammelt wurden;
  • der EnCodec-Decoder ermöglicht die Erzeugung von Klängen mit weniger Artefakten.

Meta ist überzeugt, dass AudioCraft das Potenzial hat, eine neue Welle von Liedern auszulösen, ähnlich wie Synthesizer einst die Musik veränderten. Das Unternehmen hat auch den Quellcode des Tools geöffnet, um die zum Training verwendeten Daten zu diversifizieren.

Auf der Website des Projekts können Sie sich Hörproben der von AudioCraft erzeugten Musik und Klänge anhören. Der Quellcode des Tools ist auf GitHub verfügbar.

Quelle: Meta AI