Google bringt ab heute sein künstliches Intelligenzmodell Gemini der nächsten Generation in seinen Bard-Chatbot ein. Das Unternehmen gibt an, dass es sowohl die Leistung als auch die Denkfähigkeit von Bard erheblich verbessern wird – indem es ihm die Möglichkeit gibt, Bilder, Text, Code, Audio und Video nativ zu verstehen.
Es gab einige Spekulationen darüber, dass es aufgrund von Problemen mit dem Verständnis bestimmter Sprachen zu Verzögerungen kommen würde, und die neue Version wird nur auf Englisch verfügbar sein. Während eines Pressegesprächs teilte Google Reportern jedoch mit, dass es in mehreren Sprachen gut funktioniere.
Google hat seinen Bard-Chatbot vor acht Monaten als Experiment und als Reaktion auf den Erfolg von ChatGPT eingeführt. Dies ist das dritte Modell, das dem Tool seit seiner Einführung zugrunde liegt, beginnend mit LaMDA, dem Upgrade auf PaLM 2 im Sommer, als es auf den Markt kam, und jetzt Gemini.
Sissie Hsiao, Vizepräsidentin von Google Bard, sagte, dass Bard in Blindbewertungen mit externen Testern als der am meisten bevorzugte kostenlose Chatbot hervorgegangen sei.
Was sind Zwillinge?
Gemini ist in drei Versionen unterteilt: Nano, das auf Mobilgeräten läuft, Pro, das für Bard verwendet wird, und Ultra, das nächstes Jahr auf den Markt kommt und einen neuen Bard Advanced antreibt.
Laut Google schneidet Gemini Pro genauso gut oder besser ab als GPT-3.5, das Modell von OpenAI, das die kostenlose Version von ChatGPT unterstützt. Es wird nicht darauf zurückgegriffen, wie Gemini Ultra im Vergleich zu GPT-4 abschneidet, sondern lediglich darauf hingewiesen, dass es bei wichtigen Benchmarks „alle verfügbaren Modelle“ übertrifft.
„Zwillinge können die Welt um uns herum genauso verstehen wie wir und können jede Art von Input und Output aufnehmen. Nicht nur Text wie bei den meisten Modellen, sondern auch Code, Audio, Bild und Video“, sagte Demis Hassabis, CEO von Google DeepMind.
Wie wird es Bard verändern?
Bard wurde seit seiner Einführung schrittweise verbessert und um einige multimodale Funktionen wie die Analyse des Inhalts eines Bildes erweitert. Außerdem wurden Erweiterungen hinzugefügt, mit denen Sie Flüge überprüfen, den Inhalt eines YouTube-Videos überprüfen oder Ihre E-Mails abrufen können.
Mit Zwillingen wird es etwas völlig Neues. Auch wenn es auf den ersten Blick vielleicht nicht anders aussieht, steckt unter der Haube eine leistungsstärkere Engine, die laut Google durchweg über bessere Fähigkeiten verfügen wird – zumindest auf Augenhöhe mit der kostenlosen Version von ChatGPT.
Es basiert auf einer fein abgestimmten Version von Gemini Pro in Englisch, weitere Sprachen kommen im neuen Jahr hinzu. Dies verbessert die Argumentations-, Planungs- und Verständnisfähigkeiten im Vergleich zur Vorgängerversion, die auf PaLM 2 basiert.
Die erste Version wird nur mit textbasierten Eingabeaufforderungen funktionieren, aber da Gemini von Grund auf multimodal konzipiert wurde, werden im nächsten Jahr weitere Medien hinzukommen.
Was kommt als nächstes? Barde Fortgeschritten
Irgendwann im nächsten Jahr bringt Google eine neue Version seines Chatbots namens Bard Advanced auf den Markt. Es ist noch nicht klar, ob es sich hierbei um einen kostenpflichtigen Dienst ähnlich wie ChatGPT Plus handeln wird, aber er wird von Gemini Ultra, der leistungsstärksten Version des KI-Modells, unterstützt.
Gemini Ultra wurde für „hochkomplexe Aufgaben und zum schnellen Verstehen und Reagieren auf verschiedene Arten von Informationen“ entwickelt und läuft auf den leistungsstärksten Chips im Google-Rechenzentrumsnetzwerk
Laut Google wird Bard Advanced Zugriff auf alle Funktionen von Gemini Ultra bieten, aber zunächst müssen weitere Sicherheitsüberprüfungen und Tests durchgeführt werden. „Dies steht im Einklang mit dem mutigen und verantwortungsvollen Ansatz, den wir seit der Einführung von Bard verfolgt haben“, sagte Hsiao.
„Mit Gemini kommen wir unserer Vision, Bard zum besten KI-Kollaborateur der Welt zu machen, einen Schritt näher“, fügte sie hinzu. „Wir freuen uns darauf, weiterhin die neuesten Fortschritte in Bard einzubringen und zu sehen, wie Sie es zum Erstellen, Lernen und Erkunden nutzen.“
Gemini kommt Anfang nächsten Jahres auch über Duet AI zu Google Workspace. Dies ermöglicht eine detailliertere Generierung von Text und Bildern mit Dokumenten, Tabellen und Folien. Das Unternehmen experimentiert damit auch in der Suche, um die Ergebnisse zu beschleunigen und komplexere Abfragen zu ermöglichen.