ChatGPT und Midjourney mögen die Vorreiter der KI-gestützten Revolution bei Chatbots und Bilderstellung sein, aber Giganten wie Adobe werden nicht zurückgelassen – und das Unternehmen hinter Photoshop hat einige neue KI-Tools vorgestellt, die die Videobearbeitung vollständig demokratisieren könnten.
Im März sahen wir die Ankunft von Adobe Firefly, der neuen Familie generativer KI-Tools des Unternehmens. Und jetzt hat Adobe genau in der Vorschau gezeigt, wie Firefly seine Video-, Audio-, Animations- und Bewegungsgrafik-Apps antreiben wird, die anfängerfreundliche Video-Editoren wie Adobe Premiere Rush oder Spark Video umfassen könnten.
Obwohl es sich bei den Funktionen nur um Vorschauen und nicht um bevorstehende Updates handelt, ist klar, wie leistungsfähig diese Text-zu-Bild-Tools werden. Wir haben bereits gesehen, wie nützlich die textbasierte Bearbeitung in Premiere Pro sein wird, aber diese neuen Tools scheinen besonders für Anfänger geeignet zu sein – tatsächlich könnten sie die Notwendigkeit, komplexe Videobearbeitungswerkzeuge in den meisten Situationen zu lernen, vollständig zunichte machen.
Ein von Adobe gezeigtes Beispiel sind beispielsweise Text-zu-Farbe-Verbesserungen für Videos. Geben Sie die gewünschte Tageszeit, Jahreszeit oder das gewünschte Farbschema für ein vorhandenes Video ein, und es kann die erforderlichen Änderungen vornehmen. Sogar vage Aufforderungen wie „Diese Szene soll sich warm und einladend anfühlen“ funktionieren in Firefly-basierten Programmen.
Nicht, dass Sie nur auf die automatische Farbkorrektur beschränkt sind. So ziemlich jeder Aspekt der Videoerstellung, von Musik, Soundeffekten, Texten, Logos und B-Roll, kann in neuen KI-gestützten Textfeldern bearbeitet werden, wie wir sie in ChatGPT gesehen haben.
In der „Meet Adobe Firefly for Video“-Demo des Unternehmens fügt eine Eingabeaufforderung für „helle, abenteuerliche, fröhliche Musik“ (geben Sie einfach Ihre Begriffe ein und klicken Sie auf „Generieren“) eine lizenzfreie Hintergrundmelodie für ein Video hinzu, zusammen mit der Option zum Hinzufügen von Ozeanschaum-Soundeffekten passend zur Szene.
Das zeitsparende Potenzial dieser neuen KI-Tools wird auch aus der Demo „Generate Captions“ deutlich, die zeigt, wie ein Transkript analysiert und in zeitlich perfekt abgestimmte Untertitel für ein kurzes soziales Video aufgeteilt wird. In ähnlicher Weise durchsucht eine Schaltfläche „Find B-Roll“ ein automatisch generiertes Skript und legt geeignete Cutaway-Clips in einer Videozeitleiste ab.
Die vielleicht überwältigendste Idee von allen ist jedoch eine Schaltfläche zum Erstellen von Storyboards, die erneut ein geschriebenes Skript scannt (wenn auch eines mit klareren, von Menschen gemachten Hinweisen wie „Weitwinkel“ und „Nahaufnahme“) und skizziert eine ganze Folge von Aufnahmen, denen Sie (oder Ihr Video-Shooter) folgen können.
Diese Bearbeitungskonzepte befinden sich eindeutig in einem frühen Stadium, und es gibt keinen Zeitplan für ihre Einführung in den Programmen von Adobe. Da wir uns auch in einer Art KI-Hype-Blase befinden, halten wir uns mit einem Urteil zurück, bis wir sehen, dass sie in Adobe-Apps ausgeliefert werden, und können sie in der realen Welt ausprobieren.
Aber das Potenzial für die Videoerstellung, insbesondere für jeden, der Werbe- oder Social-Media-Kurzfilme macht, ist riesig – und Adobe ist am besten aufgestellt, um dies alles realisierbar zu machen, da seine Modelle anscheinend mit offen lizenzierten oder gemeinfreien Inhalten trainiert wurden an dem das Urheberrecht abgelaufen ist.
Analyse: Die Macht der Eingabeaufforderungen
Genau wie die besten KI-Kunstgeneratoren sind die neuen Firefly-Tools von Adobe für Videos kein Ersatz für echte Kreativität oder erfahrene Videokünstler. Aber sie werden wahrscheinlich einem ganz neuen Publikum grundlegende Videobearbeitungsfähigkeiten eröffnen und die Benutzerfreundlichkeit von Apps wie Adobe Premiere Rush auf ein ganz neues Niveau heben.
Tools wie Text-zu-Farbe-Verbesserungen und automatische B-Roll-Generierung haben auch ein starkes zeitsparendes Element – der gesamte Prozess der Videobearbeitung, einschließlich Musik, Soundeffekten und Untertiteln, könnte drastisch verkürzt werden, wenn die Tools ebenfalls funktionieren wie sie es in den Demos tun.
Genau wie bei ChatGPT besteht die erforderliche Schlüsselkompetenz wahrscheinlich darin, zu lernen, welche Eingabeaufforderungen verwendet werden müssen, um die gewünschte Bearbeitung oder den gewünschten Effekt zu erzielen. Einer der Hauptvorteile von Firefly scheint die Verarbeitung natürlicher Sprache und die Fähigkeit zu sein, vage Aussagen wie „diese Szene warm und einladend wirken zu lassen“ zu verstehen. Aber Sie müssen trotzdem wissen, wie Sie den gewünschten Look beschreiben – und je spezifischer Sie sind, desto besser wird das Endergebnis sein.
Die große Veränderung besteht jedoch darin, dass wir uns von einer Welt von Videobearbeitungs-Apps, die vollgepackt sind mit obskuren Symbolen und Jargon, zu solchen mit einfachen Textfeldern bewegen, die vage Eingabeaufforderungen verstehen können – und das wird Videobearbeitungssoftware nur für a öffnen breiteres Publikum.