Kostenlose KI-Videogeneratoren nähern sich einem entscheidenden Wendepunkt


Sie haben vielleicht bemerkte einige beeindruckende Video-Memes, die in den letzten Wochen mit KI erstellt wurden. Harry Potter als Balenciaga-Werbung neu interpretiert und alptraumhafte Aufnahmen von Will Smith isst Spaghetti beide gingen kürzlich viral. Sie zeigen, wie schnell sich die Fähigkeit der KI zur Erstellung von Videos entwickelt und wie problematisch einige Anwendungen der Technologie sein können.

Diese Videos erinnern mich an den Moment, als KI-Werkzeuge zur Bilderzeugung letztes Jahr weit verbreitet wurden, als Programme wie Craiyon (früher bekannt als DALL-E Mini) es jedem ermöglichten, erkennbare, wenn auch grobe und oft surreale Bilder zu zaubern, wie z Überwachungsaufnahmen von Babys, die eine Tankstelle ausrauben, Gerichtsskizzen von Darth VadarUnd Elon Musk isst Buntstifte.

Craiyon war eine Open-Source-Kopie des damals sorgfältig eingeschränkten DALL-E 2 Bildgenerator von OpenAI, dem Unternehmen hinter ChatGPT. Das Tool war das erste, das die Fähigkeit von KI zeigte, eine Texteingabeaufforderung zu nehmen und sie in etwas umzuwandeln, das wie echte Fotos und von Menschen gezeichnete Illustrationen aussah. Seitdem ist DALL-E für alle offen und Programme wie Zwischendurch Und Traumstudio haben ähnliche Tools entwickelt und verfeinert, wodurch es relativ trivial ist, komplexe und realistische Bilder mit ein paar Fingertipps auf einer Tastatur zu erstellen.

Da Ingenieure die algorithmischen Knöpfe und Hebel hinter diesen Bildgeneratoren optimiert, mehr Trainingsdaten hinzugefügt und für mehr GPU-Chips bezahlt haben, um alles auszuführen, sind diese Bilderzeugungswerkzeuge unglaublich gut darin geworden, die Realität vorzutäuschen. Um ein paar Beispiele aus einem Subreddit zu nehmen, der seltsamen KI-Bildern gewidmet ist, schauen Sie sich das an Alex Jones bei einer Gay-Pride-Parade oder der Bundeslade bei einem Flohmarkt.

Der weit verbreitete Zugang zu dieser Technologie und ihre Ausgereiftheit zwingt uns dazu, zu überdenken, wie wir Online-Bilder betrachten, wie hervorgehoben wurde, nachdem von KI erstellte Bilder, die angeblich die Verhaftung von Donald Trump zeigen, im letzten Monat viral wurden. Der Vorfall veranlasste Midjourney zu der Ankündigung, dass es keine kostenlose Testversion seines Dienstes mehr anbieten würde – eine Lösung, die einige schlechte Schauspieler des Geizhalses abschrecken könnte, aber das breitere Problem unangetastet lässt.

Wie Amanda Hoover von WIRED diese Woche schreibt, kämpfen Algorithmen immer noch damit, überzeugende Videos aus einer Eingabeaufforderung zu generieren. Das Erstellen vieler einzelner Frames ist rechenintensiv, und wie die heutigen zitternden und stotternden Videos zeigen, ist es für Algorithmen schwierig, eine ausreichende Kohärenz zwischen ihnen aufrechtzuerhalten, um ein sinnvolles Video zu erstellen.

KI-Tools werden jedoch immer besser darin, Videos zu bearbeiten. Das Balenciaga-Mem, zusammen mit Versionen, auf die verwiesen wird Freunde Und Wandlung zum Bösen, wurden durch die Kombination einiger verschiedener KI-Tools erstellt, um zunächst Standbilder zu generieren und dann einfache Animationseffekte hinzuzufügen. Aber das Endergebnis kann sich trotzdem sehen lassen.

Landebahn MLein Startup, das KI-Tools für die professionelle Erstellung und Bearbeitung von Bildern und Videos entwickelt, hat diese Woche a neue effizientere Technik zum Anwenden stilistischer Änderungen auf Videos. Ich habe es verwendet, um dieses traumhafte Filmmaterial meiner Katze Leona zu erstellen, die in nur wenigen Minuten aus einem bestehenden Video durch eine „Wolkenlandschaft“ läuft.

Video: Will Knight/Runway

Verschiedene maschinelle Lerntechniken eröffnen neue Möglichkeiten. Eine Firma hat angerufen Luma KIverwendet zum Beispiel eine Technik, die als neurale Strahlungsfelder bekannt ist, um 2D-Fotografien in detaillierte 3D-Szenen umzuwandeln. Geben Sie ein paar Schnappschüsse in die App des Unternehmens ein, und Sie haben eine vollständig interaktive 3D-Szene spielen mit.

Diese Clips deuten darauf hin, dass wir uns an einem Wendepunkt für die Erstellung von KI-Videos befinden. Wie bei der KI-Bilderzeugung könnten auf einen wachsenden Ansturm von Memes erhebliche Verbesserungen in der Qualität und Steuerbarkeit von KI-Videos folgen, die die Technologie an allen möglichen Orten unterbringen. KI könnte für manche Autoren zur Muse werden. Die Werkzeuge von Runway waren von Visual-Effects-Künstlern verwendet Arbeit an dem Oscar-Gewinner Alles überall auf einmal. Darren Aronofsky, Direktor von Der Wal, Schwarzer SchwanUnd Pi ist auch ein Fan von Runway.

Aber Sie müssen sich nur ansehen, wie fortschrittlich Bilder von Midjourney und Dream Studio jetzt sind, um zu erkennen, wohin sich KI-Videos entwickeln – und wie schwierig es werden kann, echte Clips von gefälschten zu unterscheiden. Natürlich können Menschen bereits Videos mit vorhandener Technologie manipulieren, aber es ist immer noch relativ teuer und schwierig durchzuziehen.

Die schnellen Fortschritte in der generativen KI können sich in einer Zeit als gefährlich erweisen, in der soziale Medien bewaffnet wurden und Deepfakes das Spielzeug von Propagandisten sind. Wie Jason Parham diese Woche für WIRED schrieb, müssen wir auch ernsthaft darüber nachdenken, wie generative KI hässliche Stereotypen wieder einfangen und wiederverwenden kann.

Im Moment ist der Instinkt, Videoclips zu vertrauen, größtenteils zuverlässig, aber es könnte nicht lange dauern, bis das Filmmaterial, das wir sehen, weniger solide und wahrheitsgemäß ist als früher.



source-114

Leave a Reply