Google stellt Veo und Imagen 3 vor, seine neuesten Modelle zur KI-Medienerstellung


Bei Google I/O dreht sich immer alles um KI! Heute hat Google seine neuen KI-Engines zur Medienerstellung angekündigt: Veo, das „hochwertige“ 1080p-Videos produzieren kann; und Imagen 3, sein neuestes Text-zu-Bild-Framework. Beides hört sich nicht besonders revolutionär an, aber sie sind eine Möglichkeit für Google, den Kampf gegen das Sora-Videomodell von OpenAI und Dall-E 3 fortzusetzen, ein Tool, das praktisch zum Synonym für KI-generierte Bilder geworden ist.

Google behauptet, Veo verfüge über „ein fortgeschrittenes Verständnis der natürlichen Sprache und der visuellen Semantik“, um jedes Video zu erstellen, das Sie sich vorstellen. Die von der KI generierten Videos können „mehr als eine Minute“ dauern. Veo ist auch in der Lage, filmische und visuelle Techniken zu verstehen, wie zum Beispiel das Konzept eines Zeitraffers. Aber das sollte doch eigentlich eine Grundvoraussetzung für ein KI-Videogenerierungsmodell sein, oder?

Um zu beweisen, dass Veo nicht darauf aus ist, Künstlern die Jobs zu stehlen, hat Google auch mit Donald Glover und seinem Kreativstudio Gilga zusammengearbeitet, um die Fähigkeiten des Modells zu demonstrieren. In einem sehr kurzen Werbevideo sehen wir, wie Glover und seine Crew mithilfe von Text ein Video erstellen, in dem ein Cabrio in einem europäischen Haus ankommt und ein Segelboot durch den Ozean gleitet. Laut Google kann Veo die Physik der realen Welt besser simulieren als seine Vorgängermodelle und hat auch die Darstellung von hochauflösendem Filmmaterial verbessert.

„Jeder wird Regisseur, und jeder sollte Regisseur sein“, sagt Glover im Video und hat sich damit seinen Google-Gehalt absolut verdient. „Im Mittelpunkt all dessen steht das Geschichtenerzählen. Je näher wir uns gegenseitig unsere Geschichten erzählen können, desto besser werden wir einander verstehen.“

Es bleibt abzuwarten, ob jemand tatsächlich KI-generierte Videos ansehen möchte, abgesehen von der krankhaften Neugier, einer Maschine zuzusehen, wie sie versucht, die Arbeit menschlicher Künstler algorithmisch nachzubilden. Aber das hindert Google oder OpenAI nicht daran, diese Tools zu bewerben und zu hoffen, dass sie nützlich sind (oder zumindest eine Menge Geld verdienen). Veo wird heute für einige YouTuber im VideoFX-Tool von Google verfügbar sein, und das Unternehmen sagt, dass es auch für YouTube Shorts und andere Produkte verfügbar sein wird. Wenn Veo am Ende ein integrierter Bestandteil von YouTube Shorts wird, ist das zumindest eine Funktion, die Google über TikTok dominieren kann.

Google IO 2024Google IO 2024

Google

Was Imagen 3 betrifft, macht Google die üblichen Versprechen: Es soll das „hochwertige“ Text-zu-Bild-Modell des Unternehmens sein, mit „unglaublichem Detaillierungsgrad“ für „fotorealistische, lebensechte Bilder“ und weniger Artefakten. Der eigentliche Test wird natürlich sein, zu sehen, wie es Eingabeaufforderungen im Vergleich zu Dall-E 3 verarbeitet. Imagen 3 verarbeitet Text besser als zuvor, sagt Google, und es ist auch intelligenter im Umgang mit Details aus langen Eingabeaufforderungen.

Google arbeitet auch mit Aufnahmekünstlern wie Wyclef Jean und Bjorn zusammen, um seine Music AI Sandbox zu testen, eine Reihe von Tools, die bei der Erstellung von Songs und Beats helfen können. Wir haben davon nur einen kurzen Einblick erhalten, aber es hat zu einigen interessanten Demos geführt:

Die Sonne geht auf und unter. Wir sterben alle langsam. Und die KI wird von Tag zu Tag intelligenter. Das scheint die große Erkenntnis aus den neuesten Medienerstellungstools von Google zu sein. Natürlich werden sie immer besser! Google investiert Milliarden in die Verwirklichung des Traums von KI, alles in dem Bestreben, den nächsten großen Sprung in der Datenverarbeitung zu schaffen. Wird irgendetwas davon unser Leben tatsächlich verbessern? Wird es ihnen jemals gelingen, Kunst mit echter Seele zu schaffen? Schauen Sie jedes Jahr wieder bei Google I/O vorbei, bis AGI tatsächlich auftaucht oder unsere Zivilisation zusammenbricht.

Informieren Sie sich über alle Neuigkeiten von Google I/O 2024 Hier!

source-115

Leave a Reply