Könnte der Text-zu-Video-Generator Sora von OpenAI Arbeitsplätze in Hollywood vernichten?


Das Startup für künstliche Intelligenz OpenAI hat in den letzten Wochen seinen neuen KI-Videogenerator Sora in den sozialen Medien angekündigt. Letzte Woche wurde bekannt, dass es auch Schauspielern und Regisseuren in Hollywood einen ersten Blick auf die Technologie – und die Möglichkeit, sie auszuprobieren – gegeben hat, bevor Sora öffentlich vorgestellt wird.

OpenAI veröffentlichte am 24. März einen Blogbeitrag mit dem Titel Soras erste Eindrücke, Präsentation der Arbeiten, die mehrere Kreativstudios und Regisseure mit dem Videogenerator produziert hatten.

Einige Medienexperten spekulieren, dass Sora die Filmbranche äußerst störend beeinflussen wird.

Al Jazeera sprach mit einem in Hollywood arbeitenden Manager, der uns aufgrund der sensiblen Natur des Themas bat, seine Identität nicht preiszugeben. Auf die Frage, wie seine erste Reaktion gewesen sei, als er Soras Fähigkeiten zum ersten Mal sah, sagte er: „Meine Reaktion auf Sora war genau wie die aller anderen – mir fiel die Kinnlade auf den Boden. Es war, als würden wir unseren Mörder sehen, aber es war gleichzeitig wunderschön. Einfach sofort beeindruckend und erschreckend.“

Die von Sora verursachten Erschütterungen haben einige in der Branche bereits gespürt.

In einem Interview mit The Hollywood Reporter im Februar erklärte der Schauspieler, Filmemacher und Studiobesitzer Tyler Perry, dass er seine 800-Millionen-Dollar-Studioerweiterung in Atlanta auf Eis legen werde, nachdem er Soras Videoproduktionsfähigkeiten gesehen habe.

Er fügte hinzu: „Ich bin daher sehr, sehr besorgt, dass in naher Zukunft viele Arbeitsplätze verloren gehen werden. Das spüre ich wirklich sehr stark.“

Was ist Sora?

Sora ist das generative Text-zu-Video-KI-Modell von OpenAI. Ähnlich wie bei ChatGPT geben Sie eine Textaufforderung ein, aber anstatt Antworten auf Fragen oder Aufforderungen in Textform zu generieren, generiert Sora Videos mit einer Länge von bis zu einer Minute.

Ein Videobeispiel der Fähigkeiten von Sora, das von Open AI veröffentlicht wurde, ist unten zu sehen:

  • Beispielaufforderung: „Ein Filmtrailer mit den Abenteuern des 30-jährigen Raumfahrers, der einen gestrickten Motorradhelm aus roter Wolle trägt, blauer Himmel, Salzwüste, filmischer Stil, aufgenommen auf 35-mm-Film, lebendige Farben.“

Sam Altman, CEO von OpenAI, hat auch mehrere Beispiele auf seinem X-Konto gepostet, darunter die folgenden:

  • Beispielaufforderung: „Eine lehrreiche Kochsitzung für hausgemachte Gnocchi, moderiert von einer Social-Media-Influencerin einer Großmutter, in einer rustikalen toskanischen Landküche mit filmischer Beleuchtung.“

Sora ist alles andere als perfekt. Schaut man sich das Video „Anleitung zum Kochen“ genau an, verschwindet der Löffel in der rechten Hand, nachdem die „Großmutter“ mit dem Mischen aufgehört hat. Obwohl sie hyperrealistisch sind, ist in einigen der von Sora produzierten Videos immer noch die Fähigkeit vorhanden, Fälschungen zu erkennen.

Dies warf eine weitere Frage auf, wie gut ein Produkt wie dieses in der Branche funktionieren würde.

Unser Hollywood-Insider erklärte Folgendes: „Wir werden auf der anderen Seite größer und besser hervorgehen, weil die Menschen ihren Platz an der Spitze einer Technologie herausgefunden haben, die eindeutig leistungsfähiger ist, als wir uns derzeit vorstellen können.“ Aber der Wunsch zu handeln, zu schreiben, Regie zu führen, zu komponieren, zusammenzuarbeiten usw. ist dem Menschen tief angeboren. Es geht nirgendwo hin. Ist es also schlecht für die Menschen in der Branche? Die Antwort lautet: Nein, dann ja, dann nein. Ist es gut für die Branche selbst? Ja.

Wie funktioniert Sora?

Wie bei ChatGPT geben Benutzer einen Textbefehl, eine Frage oder eine Aufforderung ein und die KI antwortet – im Fall von Sora mit generierten Videosequenzen.

Dazu nutzt Sora eine Kombination aus maschinellem Lernen und natürlicher Sprachverarbeitung (NLP), um eine Videosequenz zu generieren. NLP ist eine Form der künstlichen Intelligenz, die die Interaktion zwischen Computern und menschlicher Sprache versteht. Durch maschinelles Lernen kann Sora mit der Zeit besser werden und gleichzeitig seine Reaktionen durch Muster und Feedback verbessern.

Sora nutzt „Computer Vision“, um visuelle Informationen aus Bildern oder Videos zu verstehen und zu interpretieren. Computer Vision ist ein Software-Framework, das Sora anweist, visuelle Darstellungen realer Objekte, Menschen und Umgebungen anhand von Textbeschreibungen zu „erkennen“, die visuelle Sprache enthalten. Beispielsweise deuten die Aufforderungen „Katze bewegt sich“ oder „Wellen schlagen im Ozean“ auf bestimmte Attribute und Eigenschaften hin. Sora benötigt diese visuelle Sprache, um die Textaufforderung zu interpretieren und dann eine visuelle Darstellung eines Objekts präzise darzustellen.

Sora kann unvollständige oder unvollständige Daten sammeln und sie in verständliche Videoinhalte umwandeln, die sehr real aussehen. Sora funktioniert wie ein leistungsstarkes Zoom-Tool. Es beginnt mit großen, verschwommenen Farbblöcken oder Objekten und verfeinert sie dann entsprechend Ihrer Eingabeaufforderung zu kleineren, klareren Formen.

Was bedeutet Sora für kreative Jobs in der Filmbranche?

Es ist immer noch unklar, welche Aufgaben, die normalerweise von menschlichen Schöpfern übernommen werden, von Sora übernommen werden könnten. Die Fähigkeit der KI, Kameraaufnahmen, Beleuchtung und Charaktere im Handumdrehen zu reproduzieren, stellt für Regisseure und Filmemacher Neuland dar. Allerdings erwarten Filmprofis, dass es die Branche erheblich aufrütteln wird.

Ein Hollywood-Insider, der anonym mit Al Jazeera sprach, sagte: „Ich sehe darin keine Bedrohung für die Produktion, sondern vielmehr eine Bedrohung für die Art und Weise, wie wir derzeit produzieren. Wir haben in der Vergangenheit solche Ereignisse erlebt, insbesondere in der Postproduktion, als die Leute anfingen, auf Laptops zu schneiden, statt in den großen, teuren Posthäusern. Viele Leute gingen bei diesem Übergang verloren, während andere sich plötzlich einen richtigen Redakteur leisten konnten, ohne den Mehraufwand, den ein Posthaus mit sich bringt.“

Auf die Frage, wessen Arbeitsplätze durch KI-Generatoren ersetzt werden könnten, fügte er hinzu: „Vielleicht ist die Frage, wer ersetzt wird, die falsche Frage.“ Ich denke, es ist das System, das zerstört und ersetzt wird. In ein paar Jahren wird sich der Begriff „Regisseur“ vielleicht auf den Mann beziehen, der die KI steuert, und der Rest wird komplett digital erledigt. Und wenn dieser Ansatz vom Publikum akzeptiert wird, Geld einbringt und die Menschen menschliche Emotionen empfinden, dann ist das Spiel für die meisten von uns vorbei.“

Was sind die urheberrechtlichen und rechtlichen Probleme?

Sora ruft Inhalte aus bereits vorhandenen Bildern und Videos ab und erstellt dann basierend auf der Eingabeaufforderung des Benutzers ein Video neu. Wem genau gehört dieses neu generierte Video? Sollte jedem der Foto- und Videokünstler und Charakteren, auf deren Arbeit Sora bei der Erstellung des endgültigen Videos zurückgreift, eine Gebühr gezahlt werden? Das sind Fragen, die noch nicht vollständig beantwortet sind.

Im Mittelpunkt vieler der oben genannten Fragen steht die Frage, wie man den Urheber jedes generierten Inhalts verfolgen kann, einschließlich der Personen, die in das endgültige Video aufgenommen wurden.

Auf seinem YouTube-Kanal erklärte der Technologieanwalt Paul Haswell: „Wenn jemand nur ein KI-Modell verwendet und es dann unbeabsichtigt Daten einsaugt, die am Ende wie Sie aussehen, welche Rechte haben Sie dann – werden Ihre persönlichen Daten tatsächlich missbraucht?“ ? Wie können Sie beweisen, dass Ihre Daten zur Erstellung dieses Abbilds verwendet wurden?“

Er fügte hinzu: „Plötzlich findet man sich als Schauspieler in einer vollständig KI-generierten Soap wieder. Sie sind vielleicht weltberühmt, bekommen dafür aber keine Anerkennung. Sie haben vielleicht eher eine piepsige Stimme als eine tiefe Stimme, aber Ihr Gesicht wäre dasselbe. Beispielsweise würden Sie keine Anerkennung erhalten, weil Sie im Wesentlichen von der KI ausgenutzt, abgesaugt und in ein anderes Format wieder ausgewürgt wurden.“

Es gibt auch internationale Überlegungen, da das Urheberrecht je nach Land unterschiedlich ist. Wenn das Video aus einem Land stammt und in einem anderen verbreitet wird, wessen Urheberrecht gilt dann?

In seinem Blog warnte Wallace Collins, ein auf Urheber- und Markenrecht spezialisierter Unterhaltungsanwalt, dass Sora all diese Probleme „exponentiell“ ausweiten würde und sogar zu sozialen Unruhen oder anderen Formen sozialer Störungen führen könnte.

„KI hat bereits das Urheberrecht für Urheber, insbesondere im Musikbereich, durcheinander gebracht und etablierte Urheberrechts- und geistige Eigentumsnormen in der Unterhaltungswelt in Frage gestellt. Ohne irgendeine Art von Regeln des gesunden Menschenverstandes könnte Sora von den abscheulichsten Personen dazu benutzt werden, Videos zu erstellen, die Menschen verunreinigen, irreführen und erschrecken oder sogar Aufstände anzetteln könnten, die auf dem Anschein von etwas basieren, das völlig erfunden, aber völlig realistisch ist Aussehen.”

Wie werden diese Fragen entschieden?

Ein wesentlicher Teil der rechtlichen Diskussion rund um generative KI dreht sich im Hinblick auf die „faire Nutzung“ um die Frage, wer als Urheber dessen gelten sollte, was diese Tools generieren. Urheberrechtsgesetze zur fairen Nutzung erlauben die eingeschränkte Nutzung urheberrechtlich geschützter Materialien oder die Umwandlung des urheberrechtlich geschützten Werks in ein anderes Werk.

Derzeit gibt es keinen rechtlichen Präzedenzfall, der die aktuellen Fortschritte bei der Text-zu-Video-Generierung abdeckt. Im Dezember letzten Jahres reichte die New York Times jedoch eine Bundesklage gegen ChatGPT (ein Tool zur Text-zu-Text-Generierung) von OpenAI und Copilot von Microsoft wegen Urheberrechtsverletzung im südlichen Bezirk von New York (dem Bundesbezirksgericht in Manhattan) ein. Die Times behauptet, dass ChatGPT von OpenAI den Benutzern genau die gleichen Inhalte bereitstellt, die die Times bereits bereitgestellt hat.

Ian Crosby, ein Anwalt der Times, sagte: „Die Angeklagten versuchen, die massiven Investitionen der Times in ihren Journalismus auszunutzen, indem sie diese ohne Erlaubnis oder Bezahlung zur Entwicklung von Ersatzprodukten nutzen.“ Das ist in keiner Weise fairer Gebrauch.“

Im Februar reichte OpenAI beim Bundesgericht einen Antrag auf Abweisung der Klage der Times ein.

Im Februar wurden beim Gericht in Manhattan zwei weitere Urheberrechtsverletzungsklagen gegen OpenAI eingereicht – eine von The Intercept und die andere eine gemeinsame Klage von Raw Story und AlterNet.



source-120

Leave a Reply