ElevenLabs baut eine universelle KI-Synchronisationsmaschine


Nachdem Disney einen neuen Film auf Englisch herausgebracht hat, wird das Unternehmen zurückgehen und ihn lokalisieren in bis zu 46 Weltsprachen den Film einem möglichst breiten Publikum zugänglich zu machen. Dies ist ein gewaltiges Unterfangen, für das Disney eine ganze Abteilung – Disney Character Voices International Inc. – hat, um diese Aufgabe zu bewältigen. Und es ist nicht so, dass Sie Chris Pratt wieder in die Aufnahmekabine holen, um ihn zu synchronisieren GotG III Zeilen auf Isländisch und Suaheli – jede Version klingt angesichts der lokalen Synchronsprecher etwas anders. Aber mit einem neuen „KI-Synchronisationssystem“ von ElevenLabs könnten wir bald eine originalgetreue Nachbildung von Pratts Stimme erhalten, unabhängig von der auf dem Bildschirm gesprochenen Sprache.

ElevenLabs ist ein KI-Startup, das einen Dienst zum Klonen von Stimmen anbietet, der es Abonnenten ermöglicht, nahezu identische Lautäußerungen mit KI zu erzeugen, basierend auf dem Hochladen von Audiobeispielen im Wert von wenigen Minuten. Es ist nicht ganz überraschend, dass die Funktion sofort nach der Veröffentlichung in der Betaphase dazu ausgenutzt wurde, sich als Prominente auszugeben, manchmal sogar ohne deren vorheriges Wissen und Einverständnis.

Die neue KI-Synchronisationsfunktion macht im Wesentlichen dasselbe – in mehr als 20 verschiedenen Sprachen, darunter Hindi, Portugiesisch, Spanisch, Japanisch, Ukrainisch, Polnisch und Arabisch – aber legitim und mit Genehmigung. Dieses Tool ist für Medienunternehmen, Pädagogen und Internet-Influencer konzipiert, die nicht über Disney Money™ verfügen, um ihre globalen Anpassungsbemühungen zu finanzieren.

ElevenLabs behauptet, dass das System nicht nur in der Lage sein wird, „gesprochene Inhalte in wenigen Minuten in eine andere Sprache“ zu übersetzen, sondern auch neue gesprochene Dialoge in der Zielsprache mit der eigenen Stimme des Schauspielers zu generieren. Oder zumindest eine KI-generierte Erholung. Berichten zufolge ist das System sogar in der Lage, die „Emotion und Intonation“ des bestehenden Dialogs beizubehalten und diese auf die generierte Übersetzung zu übertragen.

„Es wird dem Publikum helfen, jeden gewünschten Inhalt zu genießen, unabhängig von der Sprache, die es spricht“, sagte Mati Staniszewski, CEO von ElevenLabs, in einer Pressemitteilung. „Und es bedeutet, dass Content-Ersteller einfach und authentisch ein weitaus größeres Publikum auf der ganzen Welt erreichen können.“

source-115

Leave a Reply