Was du wissen musst
- Der KI-Wettlauf verschärft sich, da Google ein neues KI-Modell (denken Sie an GPT-4 vs. GPT-3) veröffentlicht hat, um sein KI-Ökosystem voranzutreiben.
- Die Benchmarks von Google zeigen, dass Gemini GPT-4V in mehreren Leistungsmetriken übertrifft.
- Gemini wird in drei Formaten erhältlich sein: Ultra, Pro und Nano.
- Das Pixel 8 Pro wird das erste Pixel sein, das Gemini über Gemini Nano implementiert.
- Gemini Pro wird am 13. Dezember über die Gemini API in Google AI Studio verfügbar sein.
Angesichts der jüngsten Unruhen bei OpenAI mit der Entlassung und anschließenden Wiedereinstellung von Sam Altman muss Google Blut im Wasser gerochen haben, denn nur wenige Wochen später kündigte Google ein neues KI-Modell an, das offenbar leistungsfähiger als GPT-4V ist.
Google kündigte Google Gemini an denn die Zukunft der KI für Google wird Bard ab heute antreiben, und bald wird sie auch für alle KI-Produkte von Google gelten. Mit drei verschiedenen Modellgrößen: Ultra, Pro und Nano ist Gemini 1.0 so konzipiert, dass es genau wie der Rest von Google allgegenwärtig ist.
Was ist Google Gemini?
Google bezeichnet Gemini als „das leistungsfähigste und umfassendste Modell, das wir je gebaut haben“. Es ist das Backend-Modell, das Googles Stapel an KI-Produkten antreiben wird, obwohl die Entscheidung getroffen wurde, das Modell in drei Größen zu veröffentlichen.
- Zwillinge Ultra – Googles größtes und leistungsfähigstes Modell für hochkomplexe Aufgaben.
- Zwillinge Pro – Googles bestes Modell zur Skalierung für ein breites Aufgabenspektrum.
- Zwillinge Nano – Googles effizientestes Modell für Aufgaben auf dem Gerät.
Einige der von Google für Gemini angepriesenen Leistungszahlen sind ziemlich beeindruckend, aber wenn ich eines im technischen Bereich gelernt habe: Vertrauen Sie nicht den Benchmarks der Hersteller. Allerdings ist es schwierig, die Wirksamkeit von Gemini in Frage zu stellen, wenn man sieht, wie es live funktioniert. @rowancheung auf X(Twitter) hat ein Video gepostet Es zeigt Gemini in Aktion und die Ergebnisse sind geradezu bemerkenswert.
🚨 BREAKING: Google DeepMind hat gerade Gemini enthüllt – den größten Konkurrenten von ChatGPT. Gemini ist die ERSTE multimodale KI, die menschliche Experten im MMLU übertrifft und über 90 % erreicht. pic.twitter.com/A7It1hPKGQ6. Dezember 2023
Wie funktioniert Google Gemini?
Google preist Gemini anhand der veröffentlichten Benchmarks als das beste KI-Modell der Welt an. Wenn diese Benchmarks den Tests von Drittanbietern standhalten, wird Gemini der Spitzenreiter auf dem Markt sein, zumindest bis OpenAI ChatGPT-5 veröffentlicht. Die wichtigste Regel in der Wirtschaft, wie sie derzeit strukturiert ist, lautet: Wenn Unternehmen um das beste Produkt konkurrieren, gewinnen in der Regel die Verbraucher.
Gemini sollte OpenAI dazu drängen, weiterhin Innovationen voranzutreiben, aber offensichtlich gab es viele Bedenken hinsichtlich rücksichtsloser Forschung ohne angemessene Berücksichtigung der Sicherheit, selbst von CEOs wie Satya Nadella, die KI mit Atomenergie verglichen.
Google Gemini übertraf ChatGPT-4V in den meisten von Google gezeigten Benchmarks. Teilweise um über 4 %-Punkte. Der Benchmark mit dem interessantesten Namen aus der Gruppe, HellaSwag, war derjenige, bei dem Gemini im Vergleich zu ChatGPT-4V schlechter abschnitt. Schauen Sie sich die vollständige Liste der Benchmarks an.
Fähigkeit | Benchmark | Beschreibung | Zwillinge Ultra | GPT-4V |
---|---|---|---|---|
Allgemein | MMLU | Darstellung von Fragen in 57 Fächern (inkl. MINT, Geisteswissenschaften und andere) | 90,0 % CoT@32* | 86,4 % 5-Schuss* (gemeldet) |
Argumentation | Big-Bench hart | Vielfältige anspruchsvolle Aufgaben, die mehrstufiges Denken erfordern | 83,6 % 3-Schuss | 83,1 % 3-Schuss (API), |
Zeile 2 – Zelle 0 | FALLEN | Leseverständnis (F1-Score) | 82,4 Variable Schläge | 80,9 3-Schuss (gemeldet) |
Zeile 3 – Zelle 0 | HellaSwag | Gesundes Denken für alltägliche Aufgaben | 87,8 % 10 Schuss* | 95,3 % 10 Schuss* (gemeldet) |
Mathematik | GSM8K | Grundlegende arithmetische Manipulationen (einschließlich Mathematikaufgaben für die Grundschule) | 94,4 % maj1@32 | 92,0 % 5-Schuss-CoT (gemeldet) |
Zeile 5 – Zelle 0 | MATHEMATIK | Anspruchsvolle mathematische Probleme (einschließlich Algebra, Geometrie, Vorkalkül und andere) | 53,2 % 4-Schuss | 52,9 % 4-Schuss (API) |
Code | HumanEval | Generierung von Python-Code | 74,4 % 0-Schuss (IT)* | 67,0 % 0-Schuss* (gemeldet) |
Zeile 7 – Zelle 0 | Natural2Code | Generierung von Python-Code. Neuer bereitgestellter Datensatz im HumanEval-Stil, nicht im Internet durchgesickert | 74,9 % 0-Schuss | 73,9 % 0-Schuss (API) |
Zeile 8 – Zelle 0 | Zeile 8 – Zelle 1 | Zeile 8 – Zelle 2 | Zeile 8 – Zelle 3 | Zeile 8 – Zelle 4 |
Obwohl diese Werte beeindruckend sind, sagen sie dem Durchschnittsverbraucher wahrscheinlich nicht viel. Dass Google den Gemini Nano auf das Pixel 8 Pro bringt, finde ich spannender, da es sich um ein Modell für Aufgaben auf dem Gerät handelt. Viele Hersteller beginnen damit, den von ihnen hergestellten Geräten geräteinterne KI-Funktionen wie NVIDIAs TensorRT-LLM hinzuzufügen. Für mich ist dies eine spannendere Perspektive für die Zukunft der KI, in der wir echte persönliche Assistenten in unsere Telefone integrieren und unser KI-Modell so anpassen können, dass es am besten für unsere individuellen Bedürfnisse funktioniert.
Eine der besten und wahrscheinlich möglichen zukünftigen Anwendungen für diese LLM-KIs ist etwas, von dem wir alle seit Star Trek vor über 80 Jahren geträumt haben. Ein universeller Sprachübersetzer. ChatGPT kann bereits als Übersetzer fungieren, allerdings ist die Bearbeitungszeit für die Erstellung der Übersetzungen ziemlich lang. Mittlerweile gibt es KI-Modelle, die Sprachausgaben in eine andere Sprache übersetzen können, wobei die Stimme des Originalschauspielers erhalten bleibt. Ich bin ein großer Fan von Anime sowie japanischen und koreanischen Dramen. Ich würde eine Welt lieben, in der ich auf einen Knopf auf meinem Fernseher drücken und die Stimme der Originalschauspieler hören kann, sie aber in echt nur auf Englisch höre. Zeit. Während diese Megakonzerne darum konkurrieren, einander bei der Weiterentwicklung der KI zu übertreffen, rückt diese Realität immer näher.