OpenAI hat ein Tool zum Klonen von Stimmen vorgestellt
Mariia Shalabaieva/Unsplash
OpenAI hat die Voice Engine vorgestellt, ein Tool zum Klonen von Stimmen, das die Sprache einer Person anhand eines 15-sekündigen Audiobeispiels im Wesentlichen duplizieren kann.
Was bekannt ist
Voice Engine basiert auf einer bestehenden Text-to-Speech-API und befindet sich seit 2022 in der Entwicklung. OpenAI verwendet bereits eine Version dieses Toolkits, um mit voreingestellten Stimmen zu arbeiten.
Die Technologie könnte in Bereichen wie dem Vorlesen, der Übersetzung von Sprachen und der Unterstützung von Menschen mit Sprachbehinderungen Anwendung finden. Als Beispiel beschrieb OpenAI ein Pilotprojekt an der Brown University, bei dem für einen Patienten mit einer Sprachstörung auf der Grundlage von zuvor aufgenommenen Audiodaten ein Klon der Sprachmaschine erstellt wurde.
Trotz des potenziellen Nutzens gibt es Bedenken wegen des möglichen Missbrauchs der Technologie zur Erstellung gefälschter Audioinhalte. Aus diesem Grund ist OpenAI noch nicht bereit, die Voice Engine in vollem Umfang für die Öffentlichkeit freizugeben, und konzentriert sich darauf, Datenschutz- und Sicherheitsbedenken auszuräumen.
Das Unternehmen erklärte, dass es das Feedback von Partnern aus verschiedenen Branchen, einschließlich der Regierung, der Medien und der Zivilgesellschaft, einbezieht, um eine sichere Einführung des Produkts zu gewährleisten. Alle Teilnehmer an den Vorabtests müssen sich an eine Nutzungsrichtlinie halten, die es verbietet, sich ohne Zustimmung als eine andere Person auszugeben.
OpenAI führt auch Sicherheitsmaßnahmen ein, wie z. B. Wasserzeichen zur Rückverfolgung der Herkunft von Audiodaten, proaktive Überwachung der Systemnutzung und die Erstellung einer "Liste verbotener Stimmen", um das Klonen bekannter Persönlichkeiten zu verhindern.
Preis und Zeitpunkt des Wartens
Ein genaues offizielles Veröffentlichungsdatum und der endgültige Preis wurden noch nicht bekannt gegeben. Laut TechCrunch könnte Voice Engine 15 US-Dollar pro Million Zeichen kosten, was es im Vergleich zu seinen Konkurrenten zu einer budgetfreundlichen Option macht. Eine "HD"-Version mit einem höheren Preisschild wird ebenfalls erwähnt.
Quelle: Engadget