2024 - Achtung, Hollywood! Das neueste Modell von OpenAI generiert lebensechte, minutenlange KI-Videos, weist jedoch einige kritische Schwächen auf

OpenAI fordert Archäologen auf, einen gewöhnlichen Plastikstuhl in der Wüste zu entdecken und ihn mit größter Sorgfalt auszugraben und abzustauben. — Sora kämpft mit der Aufforderung „Archäologen entdecken einen gewöhnlichen Plastikstuhl in der Wüste, graben ihn aus und stauben ihn mit größter Sorgfalt ab.“ (Bildnachweis: OpenAI)

Was du wissen musst

OpenAI hat kürzlich ein neues KI-Modell namens Sora mit Funktionen zur Videogenerierung vorgestellt.
Das Text-zu-Video-Modell kann bis zu einer Minute lange Videos generieren und dabei eine hohe Qualität und die Einhaltung der Benutzeranweisungen gewährleisten.
Allerdings fällt es Sora schwer, die Physik einer komplexen Szene zu simulieren und bestimmte Ursachen und Wirkungen zu verstehen.

Zu Beginn des Jahres trafen sich Bill Gates von Microsoft und Sam Altman von OpenAI beim Unconfuse Me-Podcast. Die beiden Revolutionsführer diskutierten alles rund um den ChatGPT-Hersteller, einschließlich Altmans Entlassung und Wiedereinstellung, die Entwicklung von GPT-5, Superintelligenz und mehr.

Sam Altman erörterte auch die Möglichkeit, Videofunktionen an den KI-gestützten Chatbot des Unternehmens zu liefern, da dies die häufigste Anfrage der meisten Benutzer ist. Er fügte hinzu, dass diese Ergänzung auf den bereits vorhandenen Sprachmodus- und Bilderzeugungsfunktionen aufbauen würde.

Und jetzt, kaum einen Monat nach der Veröffentlichung dieser Informationen, hat OpenAI ein neues Text-zu-Video-Modell namens „Synchronisation“ vorgestellt Sora. Das KI-Modell „kann Videos mit einer Länge von bis zu einer Minute erzeugen und dabei die visuelle Qualität beibehalten und den Anweisungen des Benutzers folgen.“

Ankündigung von Sora – unserem Modell, das aus einer Textaufforderung heraus minutenlange Videos erstellt: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG15. Februar 2024

Mehr sehen

Es ist zu beachten, dass das Modell nicht sofort für jedermann zugänglich sein wird. OpenAI liefert das Tool ausschließlich an „Red Teamer“, bildende Künstler, Designer und Filmemacher, die potenzielle Schadens- und Risikobereiche bewerten.

Darüber hinaus wird dies eine Möglichkeit für erfahrene Fachleute in der Filmbranche schaffen, Feedback zu geben und neue Wege für OpenAI vorzuschlagen, um das Modell voranzutreiben und zu verbessern.

Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und präzisen Details des Motivs und Hintergrunds zu erstellen. Das Modell versteht nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren.
OpenAI

Während das Modell über ein tiefes Sprachverständnis verfügt, das es ihm ermöglicht, Textaufforderungen korrekt zu interpretieren und lebensechte Zeichen zu generieren, gibt OpenAI zu, dass es auch einige Schwächen hat.

Das Unternehmen wies darauf hin, dass das Modell möglicherweise vor Herausforderungen stehen könnte, wenn versucht wird, die Physik einer komplexen Szene zu simulieren. Es kann auch schwierig sein, bestimmte Ursachen und Wirkungen zu verstehen. Laut einem von OpenAI bereitgestellten Beispiel zur weiteren Erläuterung dieser Prämisse „biss eine Person möglicherweise in einen Keks, aber danach weist der Keks möglicherweise keine Bissspur mehr auf.“

Sora hat auch die Möglichkeit, ein Video mit mehreren Aufnahmen zu erstellen, das „Charaktere und visuellen Stil präzise wiedergibt“. Wenn es jedoch um die räumlichen Details einer Eingabeaufforderung geht, kann es zu Defiziten kommen. Beispielsweise kann es schwierig sein, rechts von links zu unterscheiden oder sogar bestimmte Ereignisse, die im Laufe der Zeit stattfinden.

KI könnte weitere Berufe überflüssig machen

KI mit Blick auf eine Nachrichtenredaktion

(Bildnachweis: Future | Image Creator von Designer)

Neben den schwierigen wirtschaftlichen Zeiten liegt die generative KI an zweiter Stelle, wenn es um Faktoren geht, die sich negativ auf die Arbeitsplatzsicherheit auswirken. KI-gestützte Chatbots wie Microsoft Copilot und ChatGPT beanspruchen bereits Jobs von Journalisten. Wir haben mehrere Veröffentlichungen gesehen, die einige ihrer Mitarbeiter zugunsten dieser KI-Chatbots entlassen haben, und es stellte sich heraus, dass es ein großes Durcheinander war. Microsoft hat ein neues Programm eingeführt, das Journalisten mit Fähigkeiten ausstatten soll, die sie auf eine zukünftige Nachrichtenredaktion mit KI vorbereiten.

VERWANDT: KI-generierter Artikel empfiehlt eine Lebensmittelbank als Touristenattraktion

Sogar KI-gestützte Tools wie Microsofts Image Creator von Designer (ehemals Bing Image Creator) werden beim Entwerfen von Projekten immer besser. Dies könnte möglicherweise dazu führen, dass Architekturjobs überflüssig und obsolet werden.

Zugegeben, wenn mir jemand die von Sora generierten Videos gezeigt hätte, hätte ich nicht einmal gedacht, dass sie KI-generiert sind (sie sehen so gut aus). Und obwohl die Videos derzeit auf eine Minute begrenzt sind, ist es nur eine Frage der Zeit, bis Sie eine ganze Episode Ihrer Lieblingssendung erstellen können.

OpenAI hat angegeben, dass es an ausgefeilten Maßnahmen arbeitet, um Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit zu verhindern, bevor das Modell allgemein verfügbar gemacht wird.

source-108

Der Londoner Bürgermeister Khan gewinnt die Rekordperiode seiner dritten Amtszeit, während die Tories in lokalen Umfragen schwächeln

Hamas und Israel halten an ihren Waffenstillstandspositionen im Gazastreifen fest, nachdem die jüngsten Gespräche in Kairo abgeschlossen sind

Die Zahl der Todesopfer bei Überschwemmungen in Kenia steigt auf 288, da heftige Regenfälle und Überschwemmungen anhalten

„Der Herr der Ringe“- und „Titanic“-Schauspieler Bernard Hill ist im Alter von 79 Jahren gestorben

Achtung, Hollywood! Das neueste Modell von OpenAI generiert lebensechte, minutenlange KI-Videos, weist jedoch einige kritische Schwächen auf

Was du wissen musst

Leave a Reply Cancel reply