Was ist generative KI? – Überprüfen Sie Geek


Eine Reihe von Lensa-KI-Porträts, die von Review Geek-Autor Danny Chadwick in Auftrag gegeben wurden.
Danny Chadwick, Lensa AI

Generative KI ist eine Technologie der künstlichen Intelligenz, die möglicherweise die Art und Weise, wie wir mit Maschinen interagieren, verändern könnte. Es ist eine Art von KI, die neue Inhalte wie Text, Bilder, Audio und Video basierend auf ihrem Verständnis der Welt und den Eingaben des Benutzers erstellen kann.

In den letzten Monaten sind Apps mit generativer KI auf dem Markt explodiert. KI-Foto-App Lensa und der Chatbot von OpenAI, ChatGPT, sorgten für großes Aufsehen, weil sie hochwertige Texte und Bilder auf Abruf erstellen. Jetzt spielen Microsoft und Google eine Aufholjagd. Aber was ist generative KI und wie funktioniert sie?

Was ist generative KI?

Um es so einfach wie möglich auszudrücken: Generative AI ist eine KI (sogenannte „künstliche Intelligenz“), die einzigartige Inhalte basierend auf einer Aufforderung eines Benutzers erstellt. Zum Beispiel die Aufforderung, die Sie Lensa geben, um aus diesen coolen KI-Profilbildern eine Auswahl an Selfies zu machen. Im Fall von ChatGPT könnte eine Aufforderung lauten: „Schreibe ein Sonett über Bagels im Stil von HL Mencken.“ Die resultierenden Texte und Bilder sind völlig einzigartig und werden von der KI generiert. Und es sind nicht nur Texte und Bilder, die generative KI erstellen kann. Andere KI-Produkte können erstellen unheimliche Sprachrekonstruktionen, und es gibt sogar Dienste, die in den Startlöchern warten, die Videoinhalte basierend auf Texteingabeaufforderungen erstellen können.

ChatGPT schreibt ein Sonett über Bagels.
Danny Chadwick / Review Aussenseiter

Generative KI kombiniert zwei leistungsstarke KI-Technologien: maschinelles Lernen und die Fähigkeit, neue Inhalte zu erstellen. KI-Programmierer verwenden maschinelles Lernen, um Modelle zu erstellen, die Muster und Trends in vorhandenen Daten erkennen können, während die Generierung von Inhalten die Erstellung einzigartiger Elemente wie einer Komposition oder eines Bildes ermöglicht. Wenn eine KI über eine ausreichend große Stichprobengröße verfügt, aus der sie schöpfen kann (ihr Trainingssatz), kann sie so ziemlich alles nachbilden, was sie erkennen kann. Und da der Datensatz zum Trainieren von KI-Modellen wie ChatGPT so groß ist, kann er Elemente aus mehreren Quellen mischen und abgleichen, um etwas zu liefern, das sowohl einzigartig als auch als das erkennbar ist, wonach die Aufforderung verlangt.

Arten von generativer KI und wie sie funktionieren

Eine Roboterhand hält einen Stapel Kisten hoch.
Andrey_Popov / Shutterstock.com

Generative KI-Algorithmen gibt es in vielen Formen, sie fallen jedoch in drei allgemeine Kategorien: Generative gegnerische Netzwerke (GANs), Variations-Autoencoder (VAE) und Transformator-Modelle wie GPT-4. Jede Art von generativen KI-Algorithmen hat ihre Vor- und Nachteile.

GANs sind eine Art generativer KI, die zwei tieflernende neuronale Netze verwendet, um neue Daten zu generieren. Das erste Netzwerk, Generator genannt, wird darauf trainiert, neue Daten zu erstellen, die bestehenden Inhalten ähneln, während das zweite Netzwerk, Diskriminator genannt, darauf trainiert wird, zwischen echten und generierten Daten zu unterscheiden. Während Programmierer ihre KI trainieren, lernt der Generator, wie er immer realistischere Bilder erzeugt, die den Diskriminator glauben machen, dass sie echt sind. Dieser Vorgang wird als „Minimax-Spiel“, da jedes Netzwerk versucht, das andere zu überlisten und gleichzeitig seine eigenen Fehler zu minimieren.

Ein möglicher Nachteil von GANs ist, dass sie manchmal unrealistische oder unscharfe Bilder erzeugen können. Beispielsweise kann ein GAN, der darauf trainiert ist, Bilder von menschlichen Gesichtern zu erzeugen, manchmal Bilder mit einem zusätzlichen Augenpaar oder einer verzerrten Gesichtsstruktur erstellen. Menschliche Hände kann wie ein regelrechter Albtraum aussehen. Diese Technologie befindet sich jedoch noch in den Anfängen, und Probleme wie diese werden zu gegebener Zeit behoben.

VAEs sind eine andere Art von generativer KI, die verwendet wird, um neue, einzigartige Daten zu generieren. Im Gegensatz zu GANs verwenden VAEs a komprimierte Darstellung seiner Eingabedaten, um etwas Neues zu erzeugen, das dem Original ähnelt. VAEs werden am häufigsten verwendet, um Bilder und Videos zu erstellen, aber sie können auch Text generieren. Eine mögliche Einschränkung von VAEs besteht darin, dass ihre Daten möglicherweise nicht so vielfältig sind wie die von GANs erzeugten, da VAEs eine eingeschränktere Darstellung der Eingabedaten lernen. Außerdem leiden VAEs manchmal unter den Problemen mit verzerrtem Bild, auf die GANs stoßen.

Transformer-Modelle wie GPT-4 sind eine relativ neuere Iteration der generativen KI, die aufgrund ihrer Eigenschaften viele Blicke auf sich gezogen haben beeindruckende Leistung bei vielen Verarbeitungsaufgaben natürlicher Sprache. ChatGPT ist das aktuelle Goldstern-Beispiel eines transformatorbasierten KI-Produkts. Diese Modelle basieren auf einer Art neuronaler Netzwerkarchitektur, die als „Transformator.“ Sie sind darauf ausgelegt, riesige Datensequenzen zu verarbeiten, werden mit einem riesigen Textdatensatz trainiert und können auf eine Eingabeaufforderung kohärente und kontextrelevante Antworten geben.

Der Vorteil von Transformer-Modellen besteht darin, dass sie vielfältige und qualitativ hochwertige Texte generieren können. Sie können jedoch darunter leiden Verzerrungen und Ungenauigkeiten in den Trainingsdaten, was zu unangemessenen oder fehlerhaften Ausgaben führt. Darüber hinaus kann die enorme Menge an Rechenressourcen und Daten, die zum Trainieren und Ausführen dieser Modelle erforderlich sind, sie für einige Anwendungen schwierig und teuer machen.

Anwendungen der generativen KI

Eine Illustration von zwei Händen und einem Gehirn.
issaro prakalung / Shutterstock.com

Generative KI wird bereits in einer Vielzahl beliebter Dienste eingesetzt. Es gibt den oben erwähnten Chatbot ChatGPT, der von OpenAI und seinem Schwester-Bildgenerator erstellt wurde DALL-E. Es gibt auch eine Reihe von KI-Bildbearbeitungsprogrammen, darunter Lensa (iOS, Android), Wunder (iOS, Android), und mehr. Die gibt es alle schon eine Weile. Aber als ChatGPT startete, entschied das Silicon Valley, dass es an der Zeit war, die neue Technologie freizusetzen, und kündigte ein neues KI-Produkt nach dem anderen an.

Erst Anfang dieses Jahres haben Microsoft und Google beide KI-Verzauberungen für ihre Suchmaschinen angekündigt. Bald darauf folgten die kleineren Suchanbieter DuckDuck Go und Brave. Microsoft hat Bing und Edge um KI-Bilderzeugung sowie KI-Komponenten in seiner Office-Suite erweitert. Selbst Opera fügt ChatGPT hinzu zu seinem Desktop-Browser. Außerdem haben Shutterstock und Adobe KI-Kunstgeneratoren herausgebracht, die auf die Arbeit von entlohnten Benutzern trainiert wurden.

Aber generative KI kann weit über Bildersteller, Chatbots und Suchassistenten hinausgehen. Fachleute aus allen Lebensbereichen können diese Tools bei ihrer Arbeit verwenden. Generative KI hat potenzielle Anwendungen in Produktdesign, das es Unternehmen ermöglicht, kundenspezifische Produkte zu entwickeln, die auf die Bedürfnisse jedes Kunden zugeschnitten sind. Darüber hinaus kann es von verwendet werden medizinische Fachkräfte durch Unterstützung bei der Diagnose- und Behandlungsentwicklung.

Darüber hinaus kann generative KI personalisierte Inhalte wie Nachrichtenartikel oder Musik-Playlists erstellen. Durch die Analyse der Vorlieben und des Verhaltens eines Benutzers können generative KI-Algorithmen Inhalte generieren, die auf seine Interessen zugeschnitten sind, wodurch das Engagement und die Zufriedenheit der Benutzer gesteigert werden. Generative KI kann dabei helfen, neue Inhalte für die Unterhaltungsindustrie zu erstellen, wie z Filmskripte oder Videospiellevel. Die Fähigkeit, einzigartige, aber ähnliche Produkte zu generieren, ermöglicht es Unternehmen, mehr Inhalte schneller und in gleichbleibend hoher Qualität zu erstellen.

Das ist nur die Spitze des Eisbergs, wenn es um die Anwendungsmöglichkeiten der generativen KI geht. Die Technologie könnte auch in vielen anderen Branchen und Berufen nützliche Stellen finden. Es wäre nicht übertrieben, diese Technologie, wenn sie in großem Maßstab implementiert wird, mit der Erfindung der Druckmaschine oder der Entwicklung des Fließbands zu vergleichen, um zu sehen, wie sie die Art und Weise verändern könnte, wie wir Inhalte erstellen und konsumieren und unsere Arbeit erledigen.

Mögliche Risiken und ethische Erwägungen

Ein Schädel in einem digitalen Strom von Einsen und Nullen.
enzozo/Shutterstock.com

Natürlich birgt jede neue Technologie das Risiko, dass sie missbraucht bzw einige Gruppen negativ beeinflussen. Eine der Hauptsorgen im Zusammenhang mit der generativen KI ist, dass sie Schriftsteller, Künstler und andere kreative Typen verdrängen könnte, die ihren Lebensunterhalt damit verdienen, Artikel, Kunst, Drehbücher, Bücher und mehr zu erstellen. Ein weiterer potenzieller Nachteil der generativen KI ist, dass sie zum Erstellen von Inhalten verwendet werden könnte tiefe Fälschungen von Prominenten und Politiker, die von Videos und Bildern der echten Menschen nicht zu unterscheiden wären und sie verwenden würden, um die Öffentlichkeit zu täuschen. Und natürlich bleibt immer die Science-Fiction-Frage, was passiert, wenn wir der KI erlauben, ohne angemessene menschliche Aufsicht Entscheidungen zu treffen. Wird es sich gegen seine Schöpfer wenden oder Entscheidungen treffen, die Menschen schaden, in der Annahme, es würde helfen?

Die gute Nachricht ist, dass die meisten ethischen Fragen rund um die KI Dauerthemen des technologischen Fortschritts sind. Die Vernichtung von Arbeitsplätzen geht fast immer mit Fortschritten in der Automatisierung einher. Aber es kommt auch mit fortgeschritteneren Werkzeugen für diejenigen, die beim Handwerk bleiben. Schriftsteller, Künstler und andere Kreative haben jetzt einen leistungsstarken Assistenten, den sie verwenden können ihnen bei ihrer Berufung helfen, sie nicht unbedingt zerstören. Außerdem gibt es die Fälschung von Bildern von Prominenten und Politikern seit den ersten Bildbearbeitungsprogrammen. Und wir haben uns schon vor dem ersten auf die KI-Übernahme in Filmen vorbereitet Terminator Film. Und obwohl es sich um berechtigte Fragen und Bedenken handelt, werden sie wahrscheinlich auf eine Weise gelöst, die allen zugute kommt, oder zumindest auf eine Weise behandelt, die keinen massiven Arbeitsplatzverlust und das Kommen einer KI-Overlord-Regierung mit sich bringt.

Ein großes Problem, das viele KI-Produkte überwinden müssen, ist jedoch das Urheberrecht. Da die generative KI auf einem riesigen Datensatz aus Text, Bildern, Tönen und mehr trainiert wird, macht urheberrechtlich geschütztes Material einen besonderen Teil dessen aus, was die generative KI für neue Kreationen nutzt. Zugegeben, die Natur der generativen KI schließt eine exakte wortgetreue Nachbildung eines urheberrechtlich geschützten Werks aus, aber alles, was die generative KI erstellt, besteht aus Teilen von urheberrechtlich geschütztem Material. Oder zumindest hat die KI das Schreiben und Zeichnen anhand der Werke von Menschen gelernt. Dies könnte zu potenziellen Klagen von Schriftstellern und Künstlern führen, die der Meinung sind, dass ihre Arbeit gestohlen wurde, um die KI zu trainieren, und dass sie eine Entschädigung verdienen, oder verlangen, dass die KI „vergisst“, was sie aus ihrer Arbeit gelernt hat.

Aber man könnte argumentieren, dass die KI keine geschützte Arbeit auswendig kopiert und dass maschinelles Lernen dem menschlichen Lernen entspricht, genau wie wenn ein Autor ein Buch liest und inspiriert wird, sein eigenes in ähnlicher Weise zu schreiben. Es wird wahrscheinlich zu einem Gerichtsstreit kommen, in dem ein Richter entscheiden muss: „Was ist der Unterschied zwischen einer KI, die durch Nachahmung lernt, und einem Menschen, der dies tut?“ Und das ist nur die Spitze des Eisbergs, wenn es darum geht, alle rechtlichen Implikationen zu entwirren, die die generative KI sicherlich mit sich bringen wird. Jetzt wäre ein guter Zeitpunkt für Anwälte, ihre Informatik aufzufrischen.

Abschließende Gedanken: Willkommen in der Zukunft

Generative KI kann ebenso beängstigend wie beeindruckend und faszinierend sein. Aber es ist jetzt da und es wird nicht verschwinden. Angesichts der Akzeptanzrate in den ersten Monaten des Jahres 2023 ist es nicht schwer vorherzusagen, dass die generative KI bis Ende des Jahres in einen Großteil Ihres täglichen Lebens integriert sein wird. Und bis Ende 2024 kann es schwierig sein, sich an ein Leben ohne diese Technologie zu erinnern.



source-107

Leave a Reply