Bild grenzenlose Kreativität an Ihren Fingerspitzen


Bild Lee Unkrich, einer der herausragendsten Animatoren von Pixar, als Siebtklässler. Er starrt auf das Bild einer Lokomotive auf dem Bildschirm des ersten Computers seiner Schule. Wow, er denkt. Ein Teil der Magie lässt jedoch nach, als Lee erfährt, dass das Bild nicht einfach erschienen ist, indem er nach „einem Bild eines Zuges“ gefragt hat. Stattdessen musste es mühsam kodiert und gerendert werden – von hart arbeitenden Menschen.

Stellen Sie sich jetzt Lee 43 Jahre später vor, wie er über DALL-E stolpert, eine künstliche Intelligenz, die originelle Kunstwerke basierend auf von Menschen gelieferten Eingabeaufforderungen erzeugt, die buchstäblich so einfach sein können wie „ein Bild eines Zuges“. Während er Wörter eintippt, um ein Bild nach dem anderen zu erstellen, wird der Beeindruckend ist zurück. Nur dieses Mal geht es nicht weg. „Es fühlt sich an wie ein Wunder“, sagte er sagt. „Als die Ergebnisse erschienen, stockte mir der Atem und Tränen stiegen mir in die Augen. Es ist so magisch.“

Unsere Maschinen haben eine Schwelle überschritten. Unser ganzes Leben lang wurde uns versichert, dass Computer nicht in der Lage sind, wirklich kreativ zu sein. Doch plötzlich verwenden Millionen von Menschen eine neue Generation von KIs, um atemberaubende, nie zuvor gesehene Bilder zu erstellen. Die meisten dieser Benutzer sind nicht, wie Lee Unkrich, professionelle Künstler, und das ist der Punkt: Sie müssen es nicht sein. Nicht jeder kann wie ein Oscar-Preisträger schreiben, Regie führen und schneiden Toy Story 3 oder Kokosaber jeder kann Starten Sie einen KI-Bildgenerator und geben Sie eine Idee ein. Was auf dem Bildschirm erscheint, ist verblüffend in seinem Realismus und seiner Detailtiefe. Daher die universelle Antwort: Wow. Allein auf vier Diensten – Midjourney, Stable Diffusion, Artbreeder und DALL-E – erstellen Menschen, die mit KIs arbeiten, täglich mehr als 20 Millionen Bilder. Mit einem Pinsel in der Hand ist künstliche Intelligenz zu einem Wow-Motor geworden.

Da diese überraschenden KIs ihre Kunst aus Milliarden von Bildern gelernt haben, die von Menschen gemacht wurden, bewegt sich ihre Ausgabe um das, was wir von Bildern erwarten. Aber weil sie eine außerirdische KI sind, die selbst für ihre Schöpfer im Grunde mysteriös ist, strukturieren sie die neuen Bilder auf eine Weise um, an die wahrscheinlich kein Mensch denken würde, und füllen Details aus, für die die meisten von uns nicht die Kunstfertigkeit hätten, sich vorzustellen, geschweige denn die Fähigkeiten ausführen. Sie können auch angewiesen werden, in Sekundenschnelle weitere Variationen von etwas zu erstellen, das uns gefällt, in jedem gewünschten Stil. Dies ist letztendlich ihr größter Vorteil: Sie können neue Dinge schaffen, die nachvollziehbar und verständlich, aber gleichzeitig völlig unerwartet sind.

Tatsächlich sind diese neuen KI-generierten Bilder so unerwartet, dass – in der stillen Ehrfurcht unmittelbar nach der Beeindruckend– ein anderer Gedanke kommt fast jedem, der ihnen begegnet ist: Die von Menschen gemachte Kunst muss jetzt vorbei sein. Wer kann mit der Geschwindigkeit, Billigkeit, Größe und, ja, wilden Kreativität dieser Maschinen mithalten? Ist Kunst eine weitere menschliche Beschäftigung, die wir Robotern überlassen müssen? Und die nächste offensichtliche Frage: Wenn Computer kreativ sein können, was können sie dann noch, was uns gesagt wurde, dass sie es nicht könnten?

Ich habe die letzten sechs Monate damit verbracht, KIs zu verwenden, um Tausende beeindruckender Bilder zu erstellen, und habe oft eine Nacht Schlaf bei der endlosen Suche verloren nur noch eins mehr Schönheit im Code verborgen. Und nachdem ich die Entwickler, Power-User und andere Early Adopters dieser Generatoren befragt habe, kann ich eine sehr klare Vorhersage machen: Generative KI wird die Art und Weise verändern, wie wir so gut wie alles entwerfen. Oh, und kein einziger menschlicher Künstler wird wegen dieser neuen Technologie seinen Job verlieren.

Es ist Nein Übertreibung, Bilder zu nennen, die mit Hilfe von KI generiert wurden Mitschöpfungen. Das ernüchternde Geheimnis dieser neuen Macht ist, dass die besten Anwendungen nicht das Ergebnis des Eintippens einer einzigen Eingabeaufforderung, sondern sehr langer Gespräche zwischen Mensch und Maschine sind. Der Fortschritt für jedes Bild ergibt sich aus vielen, vielen Iterationen, Hin und Her, Umwegen und Stunden, manchmal Tagen Teamarbeit – alles auf der Grundlage jahrelanger Fortschritte im maschinellen Lernen.

KI-Bildgeneratoren sind aus der Verbindung zweier separater Technologien entstanden. Das eine war eine historische Reihe von neuronalen Deep-Learning-Netzen, die kohärente realistische Bilder erzeugen konnten, und das andere war ein natürliches Sprachmodell, das als Schnittstelle zur Bild-Engine dienen konnte. Die beiden wurden zu einem sprachgesteuerten Bildgenerator kombiniert. Forscher durchsuchten das Internet nach allen Bildern mit angrenzendem Text, z. B. Bildunterschriften, und verwendeten Milliarden dieser Beispiele, um visuelle Formen mit Wörtern und Wörter mit Formen zu verbinden. Mit dieser neuen Kombination könnten menschliche Benutzer eine Reihe von Wörtern – den Prompt – eingeben, die das gesuchte Bild beschreiben, und der Prompt würde ein Bild basierend auf diesen Wörtern generieren.



source-114

Leave a Reply