Der Videogenerator Sora von OpenAI ist atemberaubend und doch erschreckend


OpenAI stellte Sora vor, sein führender Text-zu-Video-Generator, am Donnerstag mit wunderschönen, erschreckend realistischen Videos, die die Fähigkeiten des KI-Modells demonstrieren. Sora steht jetzt einer kleinen Anzahl von Forschern und Kreativen zur Verfügung, die das Modell vor einer breiteren öffentlichen Veröffentlichung testen werden, was für die Filmindustrie eine Katastrophe bedeuten könnte Unser kollektives Deepfake-Problem.

„Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und genauen Details des Motivs und Hintergrunds zu erzeugen“, sagte OpenAI in einem Blogeintrag. „Das Modell versteht nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren.“

OpenAI hat nicht gesagt, wann Sora der Öffentlichkeit zugänglich gemacht wird.

Sora ist OpenAIs erstes Projekt zur KI-Videogenerierung und ergänzt die KI-gestützten Text- und Textfunktionen des Unternehmens BildgeneratorenChatGPT und Dall-E. Es ist einzigartig, weil es weniger ein kreatives Werkzeug als vielmehr ein „datengesteuerte Physik-Engine,“, wie der leitende Nvidia-Forscher Dr. Jim Fan betonte. Sora erzeugt nicht nur ein Bild, sondern bestimmt auch die Physik eines Objekts in seiner Umgebung und rendert auf Grundlage dieser Berechnungen ein Video.

Um Videos mit Sora zu generieren, können Benutzer einfach ein paar Sätze als Eingabeaufforderung eingeben, ähnlich wie bei KI-Bildgeneratoren. Sie können zwischen einem fotorealistischen oder einem animierten Stil wählen und so in nur wenigen Minuten schockierende Ergebnisse erzielen.

Sora ist ein Diffusionsmodell, das heißt, es generiert Videos, indem es mit einem verschwommenen, statisch gefüllten Video beginnt und es langsam in die polierten Versionen glättet, die Sie unten sehen. Die Bild- und Videogeneratoren von Midjourney und Stable Diffusion sind ebenfalls Diffusionsmodelle.

Allerdings muss ich anmerken, dass Sora von OpenAI viel besser ist. Die von Sora produzierten Videos sind länger, dynamischer und fügen sich besser zusammen als die der Konkurrenz. Sora fühlt sich an, als würde es echte Videos erstellen, während die Modelle der Konkurrenz wie eine Stop-Motion von KI-Bildern wirken. OpenAI hat mit einem Videogenerator, der die Konkurrenz in den Schatten stellt, erneut ein neues Feld der KI eröffnet.

Die von Sora produzierten Videos sind unbestreitbar unglaublich. Die Produktion dieser Videos hätte von einem echten Filmteam oder Animatoren Stunden gedauert. Sora wird die Filmindustrie wahrscheinlich genauso revolutionieren, wie ChatGPT und AI-Bildgeneratoren die Redaktions- und Designwelt schockiert haben. Es handelt sich um eine Technologie, die im Hinblick auf die Arbeitsplatzsicherheit für Videokünstler sowohl bemerkenswert als auch beängstigend ist.

OpenAI sagt, dass noch ein paar Optimierungen vorgenommen werden müssen, darunter auch das fehlende Verständnis von Ursache und Wirkung. Sora erstellt möglicherweise ein Video von einer Person, die in einen Keks beißt, aber danach weist der Keks möglicherweise keine Bissspur mehr auf. OpenAI sagt auch, dass es dem Modell an räumlichem Bewusstsein mangelt. Es kann passieren, dass Links und Rechts verwechselt werden und man nicht versteht, wie eine Person oder ein Objekt mit einer Szene interagiert.

Insbesondere die Sicherheit steht ebenfalls im Vordergrund Angesichts der Art und Weise, wie KI-Technologie in den letzten Monaten zur Erstellung von Deepfakes missbraucht wurde. OpenAI sagt, es werde Tools entwickeln, die dabei helfen, irreführende Inhalte zu erkennen, und bestehende Technologien anwenden, die schädliche Textaufforderungen ablehnen. Angesichts der Art und Weise, wie Menschen die Schutzmaßnahmen aktueller KI-Modelle umgangen haben, ist es jedoch fraglich, wie erfolgreich diese Bemühungen sein werden.

Sora ist ebenso beeindruckend wie erschreckend, und es ist klar, wie dieser leistungsstarke KI-Videogenerator die Filmindustrie revolutionieren und schädliche Ergebnisse erzeugen könnte. Stellen Sie sich vor, wenn die Bei den Deepfakes von Taylor Swift handelte es sich um Videos. Oder was wäre, wenn die Joe Bidens Deepfake-Anruf an Wähler in New Hampshire war eine fotorealistische Botschaft aus dem Oval Office? Sora ist noch nicht öffentlich verfügbar, aber die Auswirkungen einer so leistungsstarken Technologie sind bereits vor der Einführung bekannt.

source-113

Leave a Reply