Microsoft enthüllt VALL-E, ihre gruselige KI, die Stimmen imitieren kann


Ein Forscherteam von Microsoft hat ein Papier über VALL-E veröffentlicht, ihre neue KI, die realistische Nachahmungen menschlicher Sprache basierend auf nur 3-Sekunden-Samples erzeugen kann. Es ist eine besorgniserregende Entwicklung für Synchronsprecher sowie für alle, die glauben könnten, sie würden mit einem Verwandten telefonieren, der dringend ihre Kartendaten benötigt. Ich bin normalerweise von der Beeindruckung neuer KI-Tricks beeindruckt, bevor ich an ihre negativen Auswirkungen denke, aber ich fand das von Anfang an beunruhigend.

Einige der Samples können Sie selbst abspielen auf der Github-Demo von Microsoftoder sehen Sie sich das Video unten an.

Die Forscher beschreiben VALL-E als ein „neuronales Codec-Sprachmodell“, trainiert auf „diskreten Codes, die von einem handelsüblichen neuronalen Audio-Codec-Modell abgeleitet werden“. Sie sagen auch, dass es auf 60.000 Stunden Sprache trainiert wurde, „was hundertmal größer ist als bestehende Systeme“. KI, die entwickelt wurde, um menschliche Sprache realistisch nachzuahmen, gibt es schon seit einiger Zeit, aber diese Beispiele überzeugen, während andere Versuche es sind ziemlich eindeutig Roboter.

Wie die Forscher betonen, kann VALL-E „die Emotionen und die akustische Umgebung des Sprechers“ der Eingabeaufforderung bewahren. Das ist beeindruckend, aber etwas anderes, als in einer Aufführung den richtigen Ton und die richtige Emotion zu treffen, also ist es noch ein langer Weg, Synchronsprecher zu ersetzen. Ich kann mir nicht einmal eine fortgeschrittene Version von VALL-E vorstellen, die Leistungen erbringt, die die von talentierten Profis überstrahlen – aber Unternehmen neigen dazu, das zu verfolgen, was kosteneffektiv ist, anstatt das Beste.

Es ist eine aufregende Zeit für KI-Fortschritte, da Chat-GPT jetzt dazu in der Lage ist Schreiben von Aufsätzen und Korrigieren von Codierungsfehlernwährend Midjourney und DALL-E Bilder ausspucken, die Sie leicht verwechseln können für die Arbeit menschlicher Künstler. Ich wünschte, wir könnten mit all diesen Spielzeugen in einer Welt spielen, in der sie nicht die Lebensgrundlagen der Menschen bedrohen.



source-86

Leave a Reply