Der Technologieriese Google hat Gemini offiziell eingeführt, sein neuestes Modell für künstliche Intelligenz, von dem es behauptet, es habe OpenAIs GPT-4 übertroffen.
Am 6. Dezember gaben Sundar Pichai, CEO von Google, und Demis Hassabis, CEO und Mitbegründer von Google DeepMind, die Einführung von Gemini in einem Unternehmen bekannt Blogeintrag
Das KI-Modell wurde für verschiedene Größen und Anwendungsfälle (Ultra, Pro, Nano) optimiert und multimodal aufgebaut, um verschiedene Arten von Informationen zu verstehen und zu kombinieren.
Das Modell ist im Vergleich zu GPT-4 von OpenAI, das keine Mathematik durchführen kann, auch in Mathematik und spezieller Codierung fortgeschritten.
Unterdessen behauptet Google, dass seine Ultra-Version bei 30 von 32 akademischen Benchmarks, die in der LLM-Entwicklung (Large Language Model) verwendet werden, „Leistung auf dem neuesten Stand der Technik“ erreicht.
Darüber hinaus erreicht es laut Google 90 % bei einem MMLU-Test (Massive Multitask Language Understanding) und übertrifft damit die Leistung menschlicher Experten.
Der Chefwissenschaftler von Google, Jeff Dean, sagte, Gemini Ultra sei das erste Modell, „das eine menschliche Expertenleistung bei MMLU bei 57 Probanden mit einem Wert von über 90 % erreicht.“
Ich freue mich sehr, heute unsere Arbeit zu Gemini zu teilen! Gemini ist eine Familie multimodaler Modelle, die wirklich starke Fähigkeiten in den Bereichen Bild, Audio, Video und Text aufweisen. Unser leistungsstärkstes Modell, Gemini Ultra, übertrifft den Stand der Technik in 30 von 32 Benchmarks,… pic.twitter.com/sQfxBy9tpT
— Jeff Dean (@) (@JeffDean) 6. Dezember 2023
Das System wurde außerdem von Grund auf so konzipiert, dass Text, Bilder, Audio und Video nahtlos verarbeitet werden können, wodurch es seinen Mitbewerbern einen Schritt voraus ist.
„Wir haben Gemini von Anfang an so konzipiert, dass es multimodal ist“, sagte Dean und fügte hinzu, „anstatt mit einem reinen Textmodell zu beginnen und dann nachträglich Bild- und Audio-Encoder hinzuzufügen.“
Gemini verfügt außerdem über fortgeschrittene Programmierkenntnisse, einschließlich der Generierung von hochwertigem Code mit AlphaCode 2, einem fortschrittlichen Codegenerierungssystem. Es kann auch komplexe Programmierprobleme lösen und mit Entwicklern zusammenarbeiten.
Laut KI-Experte Rowan Cheung, Gemini Pro übertroffen GPT-3.5 in sechs von acht Benchmarks, „was ihn zum derzeit leistungsstärksten kostenlosen Chatbot auf dem Markt macht.“
Verwandt: IBM, Meta und andere bilden die „AI Alliance“, um die KI-Entwicklung voranzutreiben
Für diejenigen, die das neue KI-Modell ausprobieren möchten, wurde laut Google bereits eine fein abgestimmte Version von Gemini Pro für Googles Version von ChatGPT – bekannt als Bard – eingeführt.
„Dies ist das größte Upgrade von Bard seit seiner Einführung. Es wird in mehr als 170 Ländern und Territorien auf Englisch verfügbar sein, und wir planen, in naher Zukunft auf verschiedene Modalitäten zu expandieren und neue Sprachen und Standorte zu unterstützen“, sagte das Unternehmen.
Gemini wird auch auf Googles Flaggschiff-Handy, dem Pixel 8 Pro, eingeführt.
„Pixel 8 Pro ist das erste Smartphone, das für Gemini Nano entwickelt wurde, das neue Funktionen wie Summarize in der Recorder-App und die Einführung von Smart Reply in Gboard ermöglicht, beginnend mit WhatsApp – weitere Messaging-Apps folgen im nächsten Jahr“, hieß es.
Es werde „in den kommenden Monaten“ für weitere Google-Produkte und -Dienste wie Suche, Anzeigen und Chrome bereitgestellt, fügte er hinzu.
Der Technologieriese hat auch damit begonnen, mit Gemini zu experimentieren, um seine webdominierte Suchmaschine zu betreiben und die Suche zu einem generativen Erlebnis zu machen.
Google hat Gemini Anfang des Jahres vorgestellt, seine Fähigkeiten angepriesen und behauptet, es sei leistungsfähiger als ChatGPT.
Zeitschrift: AI Eye: Echte Einsatzmöglichkeiten für KI in Krypto, Googles GPT-4-Rivale, KI-Vorteil für schlechte Mitarbeiter