Was du wissen musst
- OpenAI hat kürzlich ein neues KI-Modell namens Sora mit Funktionen zur Videogenerierung vorgestellt.
- Das Text-zu-Video-Modell kann bis zu einer Minute lange Videos generieren und dabei eine hohe Qualität und die Einhaltung der Benutzeranweisungen gewährleisten.
- Allerdings fällt es Sora schwer, die Physik einer komplexen Szene zu simulieren und bestimmte Ursachen und Wirkungen zu verstehen.
Zu Beginn des Jahres trafen sich Bill Gates von Microsoft und Sam Altman von OpenAI beim Unconfuse Me-Podcast. Die beiden Revolutionsführer diskutierten alles rund um den ChatGPT-Hersteller, einschließlich Altmans Entlassung und Wiedereinstellung, die Entwicklung von GPT-5, Superintelligenz und mehr.
Sam Altman erörterte auch die Möglichkeit, Videofunktionen an den KI-gestützten Chatbot des Unternehmens zu liefern, da dies die häufigste Anfrage der meisten Benutzer ist. Er fügte hinzu, dass diese Ergänzung auf den bereits vorhandenen Sprachmodus- und Bilderzeugungsfunktionen aufbauen würde.
Und jetzt, kaum einen Monat nach der Veröffentlichung dieser Informationen, hat OpenAI ein neues Text-zu-Video-Modell namens „Synchronisation“ vorgestellt Sora. Das KI-Modell „kann Videos mit einer Länge von bis zu einer Minute erzeugen und dabei die visuelle Qualität beibehalten und den Anweisungen des Benutzers folgen.“
Ankündigung von Sora – unserem Modell, das aus einer Textaufforderung heraus minutenlange Videos erstellt: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG15. Februar 2024
Es ist zu beachten, dass das Modell nicht sofort für jedermann zugänglich sein wird. OpenAI liefert das Tool ausschließlich an „Red Teamer“, bildende Künstler, Designer und Filmemacher, die potenzielle Schadens- und Risikobereiche bewerten.
Darüber hinaus wird dies eine Möglichkeit für erfahrene Fachleute in der Filmbranche schaffen, Feedback zu geben und neue Wege für OpenAI vorzuschlagen, um das Modell voranzutreiben und zu verbessern.
Während das Modell über ein tiefes Sprachverständnis verfügt, das es ihm ermöglicht, Textaufforderungen korrekt zu interpretieren und lebensechte Zeichen zu generieren, gibt OpenAI zu, dass es auch einige Schwächen hat.
Das Unternehmen wies darauf hin, dass das Modell möglicherweise vor Herausforderungen stehen könnte, wenn versucht wird, die Physik einer komplexen Szene zu simulieren. Es kann auch schwierig sein, bestimmte Ursachen und Wirkungen zu verstehen. Laut einem von OpenAI bereitgestellten Beispiel zur weiteren Erläuterung dieser Prämisse „biss eine Person möglicherweise in einen Keks, aber danach weist der Keks möglicherweise keine Bissspur mehr auf.“
Sora hat auch die Möglichkeit, ein Video mit mehreren Aufnahmen zu erstellen, das „Charaktere und visuellen Stil präzise wiedergibt“. Wenn es jedoch um die räumlichen Details einer Eingabeaufforderung geht, kann es zu Defiziten kommen. Beispielsweise kann es schwierig sein, rechts von links zu unterscheiden oder sogar bestimmte Ereignisse, die im Laufe der Zeit stattfinden.
KI könnte weitere Berufe überflüssig machen
Neben den schwierigen wirtschaftlichen Zeiten liegt die generative KI an zweiter Stelle, wenn es um Faktoren geht, die sich negativ auf die Arbeitsplatzsicherheit auswirken. KI-gestützte Chatbots wie Microsoft Copilot und ChatGPT beanspruchen bereits Jobs von Journalisten. Wir haben mehrere Veröffentlichungen gesehen, die einige ihrer Mitarbeiter zugunsten dieser KI-Chatbots entlassen haben, und es stellte sich heraus, dass es ein großes Durcheinander war. Microsoft hat ein neues Programm eingeführt, das Journalisten mit Fähigkeiten ausstatten soll, die sie auf eine zukünftige Nachrichtenredaktion mit KI vorbereiten.
VERWANDT: KI-generierter Artikel empfiehlt eine Lebensmittelbank als Touristenattraktion
Sogar KI-gestützte Tools wie Microsofts Image Creator von Designer (ehemals Bing Image Creator) werden beim Entwerfen von Projekten immer besser. Dies könnte möglicherweise dazu führen, dass Architekturjobs überflüssig und obsolet werden.
Zugegeben, wenn mir jemand die von Sora generierten Videos gezeigt hätte, hätte ich nicht einmal gedacht, dass sie KI-generiert sind (sie sehen so gut aus). Und obwohl die Videos derzeit auf eine Minute begrenzt sind, ist es nur eine Frage der Zeit, bis Sie eine ganze Episode Ihrer Lieblingssendung erstellen können.
OpenAI hat angegeben, dass es an ausgefeilten Maßnahmen arbeitet, um Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit zu verhindern, bevor das Modell allgemein verfügbar gemacht wird.