Googles Gemini ist der eigentliche Beginn des generativen KI-Booms


Die Geschichte der künstlichen Intelligenz wurde von Phasen des sogenannten „KI-Winters“ geprägt, in denen die Technologie in eine Sackgasse zu geraten schien und die Finanzierung versiegte. Jedes einzelne davon wurde von Erklärungen begleitet, dass es einfach zu schwierig sei, Maschinen wirklich intelligent zu machen, als dass Menschen es herausfinden könnten.

Die Veröffentlichung von Gemini durch Google, von dem behauptet wird, es handele sich um eine grundlegend neue Art von KI-Modell und das bisher leistungsstärkste des Unternehmens, deutet darauf hin, dass nicht so schnell ein neuer KI-Winter bevorsteht. Obwohl die 12 Monate seit dem Start von ChatGPT ein Rekordjahr für KI waren, gibt es gute Gründe zu der Annahme, dass der aktuelle KI-Boom erst am Anfang steht.

OpenAI hatte keine großen Erwartungen, als es im November 2022 die „zurückhaltende Forschungsvorschau“ namens ChatGPT startete. Es handelte sich lediglich um einen Test einer neuen Schnittstelle für seine textgenerierenden Large Language Models (LLMs). Aber die Fähigkeit des Chatbots, so viele Dinge zu tun, von der Synthese von Essays und Gedichten bis hin zur Beantwortung von Codierungsproblemen, hat viele Menschen beeindruckt und verunsichert und die Tech-Branche in Aufruhr versetzt. Als OpenAI sein neues GPT-4 LLM zu ChatGPT hinzufügte, waren einige Experten so erschrocken, dass sie das Unternehmen anflehten, langsamer zu werden.

Es gab bereits kaum Beweise dafür, dass irgendjemand diesem Alarmruf Beachtung schenkte. Es ist unvorstellbar, dass Google jetzt mit der Ankündigung von Gemini den Einsatz erhöht – und vielleicht auch die Spielregeln geändert hat.

Google hatte bereits Anfang des Jahres eine direkte Reaktion auf ChatGPT in Form von Bard herausgebracht und schließlich die LLM-Chatbot-Technologie auf den Markt gebracht, die es früher als OpenAI entwickelt hatte, sich aber dafür entschieden hatte, privat zu bleiben. Mit Gemini soll eine neue Ära eingeläutet worden sein, die über hauptsächlich textbasierte LLMs hinausgeht – und möglicherweise den Grundstein für eine neue Runde von KI-Produkten gelegt hat, die sich erheblich von denen unterscheiden, die durch ChatGPT ermöglicht werden.

Google nennt Gemini ein „nativ multimodales“ Modell, das heißt, es kann aus Daten lernen, die über den reinen Text hinausgehen, und auch Erkenntnisse aus Audio, Video und Bildern gewinnen. ChatGPT zeigt, wie KI-Modelle beeindruckend viel über die Welt lernen können, wenn genügend Text bereitgestellt wird. Und einige KI-Forscher haben das einfach argumentiert Sprachmodelle größer machen würden ihre Fähigkeiten so weit steigern, dass sie mit denen des Menschen konkurrieren würden.

Aber man kann nur begrenzt viel über die physische Realität lernen, indem man den Textfilter verwendet, den Menschen darüber geschrieben haben, und die schwer zu beseitigenden Einschränkungen von LLMs wie GPT-4 – wie halluzinierende Informationen, schlechte Argumentation und ihre seltsame Sicherheit Mängel – scheinen darauf hinzudeuten, dass die Skalierung bestehender Technologie ihre Grenzen hat.

Vor der gestrigen Gemini-Ankündigung sprach WIRED mit Demis Hassabis, der Führungskraft, die die Entwicklung von Gemini leitete und zu deren früheren Erfolgen unter anderem die Leitung des Teams gehört, das den übermenschlichen Go-Playing-Bot AlphaGo entwickelt hat. Er war vorhersehbar überschwänglich gegenüber Gemini und behauptete, es führe neue Funktionen ein, die die Produkte von Google letztendlich hervorheben werden. Aber Hassabis sagte auch, dass LLMs mit anderen KI-Techniken kombiniert werden müssen, um KI-Systeme bereitzustellen, die die Welt auf eine Weise verstehen können, die heutige Chatbots nicht können.

Hassabis befindet sich in einem aggressiven Wettbewerb mit OpenAI, aber die Konkurrenten scheinen sich einig zu sein, dass radikal neue Ansätze erforderlich sind. Ein bei OpenAI laufendes mysteriöses Projekt namens Q* deutet darauf hin, dass das Unternehmen auch Ideen erforscht, die mehr beinhalten als nur die Skalierung von Systemen wie GPT-4.

Das passt zu den Bemerkungen von OpenAI-CEO Sam Altman am MIT im April, als er klarstellte, dass der Bereich der KI trotz des Erfolgs von ChatGPT einer großen neuen Idee bedarf, um bedeutende weitere Fortschritte zu erzielen. „Ich denke, wir sind am Ende der Ära, in der es diese riesigen Modelle geben wird“, sagte Altman. „Wir werden sie auf andere Weise verbessern.“

Möglicherweise hat Google gerade einen Ansatz demonstriert, der über ChatGPT hinausgehen kann. Aber die vielleicht bemerkenswerteste Botschaft der Einführung von Gemini ist, dass Google auf etwas Bedeutenderes als die heutigen Chatbots hinarbeiten will – so wie es auch bei OpenAI zu sein scheint.

source-114

Leave a Reply