2024 - Google Gemini versucht, ChatGPT in den Rückspiegel zu rücken

Was du wissen musst

Der KI-Wettlauf verschärft sich, da Google ein neues KI-Modell (denken Sie an GPT-4 vs. GPT-3) veröffentlicht hat, um sein KI-Ökosystem voranzutreiben.
Die Benchmarks von Google zeigen, dass Gemini GPT-4V in mehreren Leistungsmetriken übertrifft.
Gemini wird in drei Formaten erhältlich sein: Ultra, Pro und Nano.
Das Pixel 8 Pro wird das erste Pixel sein, das Gemini über Gemini Nano implementiert.
Gemini Pro wird am 13. Dezember über die Gemini API in Google AI Studio verfügbar sein.

Angesichts der jüngsten Unruhen bei OpenAI mit der Entlassung und anschließenden Wiedereinstellung von Sam Altman muss Google Blut im Wasser gerochen haben, denn nur wenige Wochen später kündigte Google ein neues KI-Modell an, das offenbar leistungsfähiger als GPT-4V ist.

Google kündigte Google Gemini an denn die Zukunft der KI für Google wird Bard ab heute antreiben, und bald wird sie auch für alle KI-Produkte von Google gelten. Mit drei verschiedenen Modellgrößen: Ultra, Pro und Nano ist Gemini 1.0 so konzipiert, dass es genau wie der Rest von Google allgegenwärtig ist.

Was ist Google Gemini?

Google bezeichnet Gemini als „das leistungsfähigste und umfassendste Modell, das wir je gebaut haben“. Es ist das Backend-Modell, das Googles Stapel an KI-Produkten antreiben wird, obwohl die Entscheidung getroffen wurde, das Modell in drei Größen zu veröffentlichen.

Zwillinge Ultra – Googles größtes und leistungsfähigstes Modell für hochkomplexe Aufgaben.
Zwillinge Pro – Googles bestes Modell zur Skalierung für ein breites Aufgabenspektrum.
Zwillinge Nano – Googles effizientestes Modell für Aufgaben auf dem Gerät.

Einige der von Google für Gemini angepriesenen Leistungszahlen sind ziemlich beeindruckend, aber wenn ich eines im technischen Bereich gelernt habe: Vertrauen Sie nicht den Benchmarks der Hersteller. Allerdings ist es schwierig, die Wirksamkeit von Gemini in Frage zu stellen, wenn man sieht, wie es live funktioniert. @rowancheung auf X(Twitter) hat ein Video gepostet Es zeigt Gemini in Aktion und die Ergebnisse sind geradezu bemerkenswert.

🚨 BREAKING: Google DeepMind hat gerade Gemini enthüllt – den größten Konkurrenten von ChatGPT. Gemini ist die ERSTE multimodale KI, die menschliche Experten im MMLU übertrifft und über 90 % erreicht. pic.twitter.com/A7It1hPKGQ6. Dezember 2023

Mehr sehen

Wie funktioniert Google Gemini?

Google preist Gemini anhand der veröffentlichten Benchmarks als das beste KI-Modell der Welt an. Wenn diese Benchmarks den Tests von Drittanbietern standhalten, wird Gemini der Spitzenreiter auf dem Markt sein, zumindest bis OpenAI ChatGPT-5 veröffentlicht. Die wichtigste Regel in der Wirtschaft, wie sie derzeit strukturiert ist, lautet: Wenn Unternehmen um das beste Produkt konkurrieren, gewinnen in der Regel die Verbraucher.

Gemini sollte OpenAI dazu drängen, weiterhin Innovationen voranzutreiben, aber offensichtlich gab es viele Bedenken hinsichtlich rücksichtsloser Forschung ohne angemessene Berücksichtigung der Sicherheit, selbst von CEOs wie Satya Nadella, die KI mit Atomenergie verglichen.

Gemini Ultra ist das erste Modell, das menschliche Experten im MMLU (Massive Multitask Language Understanding) übertrifft, das eine Kombination aus 57 Fächern wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik verwendet, um sowohl Weltwissen als auch Problemlösungsfähigkeiten zu testen.
Google

Google Gemini übertraf ChatGPT-4V in den meisten von Google gezeigten Benchmarks. Teilweise um über 4 %-Punkte. Der Benchmark mit dem interessantesten Namen aus der Gruppe, HellaSwag, war derjenige, bei dem Gemini im Vergleich zu ChatGPT-4V schlechter abschnitt. Schauen Sie sich die vollständige Liste der Benchmarks an.

Wischen Sie, um horizontal zu scrollen

Fähigkeit	Benchmark	Beschreibung	Zwillinge Ultra	GPT-4V
Allgemein	MMLU	Darstellung von Fragen in 57 Fächern (inkl. MINT, Geisteswissenschaften und andere)	90,0 % CoT@32*	86,4 % 5-Schuss* (gemeldet)
Argumentation	Big-Bench hart	Vielfältige anspruchsvolle Aufgaben, die mehrstufiges Denken erfordern	83,6 % 3-Schuss	83,1 % 3-Schuss (API),
Zeile 2 – Zelle 0	FALLEN	Leseverständnis (F1-Score)	82,4 Variable Schläge	80,9 3-Schuss (gemeldet)
Zeile 3 – Zelle 0	HellaSwag	Gesundes Denken für alltägliche Aufgaben	87,8 % 10 Schuss*	95,3 % 10 Schuss* (gemeldet)
Mathematik	GSM8K	Grundlegende arithmetische Manipulationen (einschließlich Mathematikaufgaben für die Grundschule)	94,4 % maj1@32	92,0 % 5-Schuss-CoT (gemeldet)
Zeile 5 – Zelle 0	MATHEMATIK	Anspruchsvolle mathematische Probleme (einschließlich Algebra, Geometrie, Vorkalkül und andere)	53,2 % 4-Schuss	52,9 % 4-Schuss (API)
Code	HumanEval	Generierung von Python-Code	74,4 % 0-Schuss (IT)*	67,0 % 0-Schuss* (gemeldet)
Zeile 7 – Zelle 0	Natural2Code	Generierung von Python-Code. Neuer bereitgestellter Datensatz im HumanEval-Stil, nicht im Internet durchgesickert	74,9 % 0-Schuss	73,9 % 0-Schuss (API)
Zeile 8 – Zelle 0	Zeile 8 – Zelle 1	Zeile 8 – Zelle 2	Zeile 8 – Zelle 3	Zeile 8 – Zelle 4

Obwohl diese Werte beeindruckend sind, sagen sie dem Durchschnittsverbraucher wahrscheinlich nicht viel. Dass Google den Gemini Nano auf das Pixel 8 Pro bringt, finde ich spannender, da es sich um ein Modell für Aufgaben auf dem Gerät handelt. Viele Hersteller beginnen damit, den von ihnen hergestellten Geräten geräteinterne KI-Funktionen wie NVIDIAs TensorRT-LLM hinzuzufügen. Für mich ist dies eine spannendere Perspektive für die Zukunft der KI, in der wir echte persönliche Assistenten in unsere Telefone integrieren und unser KI-Modell so anpassen können, dass es am besten für unsere individuellen Bedürfnisse funktioniert.

Eine der besten und wahrscheinlich möglichen zukünftigen Anwendungen für diese LLM-KIs ist etwas, von dem wir alle seit Star Trek vor über 80 Jahren geträumt haben. Ein universeller Sprachübersetzer. ChatGPT kann bereits als Übersetzer fungieren, allerdings ist die Bearbeitungszeit für die Erstellung der Übersetzungen ziemlich lang. Mittlerweile gibt es KI-Modelle, die Sprachausgaben in eine andere Sprache übersetzen können, wobei die Stimme des Originalschauspielers erhalten bleibt. Ich bin ein großer Fan von Anime sowie japanischen und koreanischen Dramen. Ich würde eine Welt lieben, in der ich auf einen Knopf auf meinem Fernseher drücken und die Stimme der Originalschauspieler hören kann, sie aber in echt nur auf Englisch höre. Zeit. Während diese Megakonzerne darum konkurrieren, einander bei der Weiterentwicklung der KI zu übertreffen, rückt diese Realität immer näher.

source-108

Eine Premium-Kaffeekette eröffnet 10 Geschäfte in einem neuen Staat

Lohnen sich Zahnspangen für Erwachsene? Wir haben 8 Personen nach ihren ehrlichen Bewertungen gefragt (SIEHE FOTOS)

Russland will seine Seegrenzen ausweiten und verärgert damit die Ostseeanrainer

Louisiana will weit verbreitete Abtreibungsmedikamente unter Kontrolle gefährlicher Substanzen herstellen

Google Gemini versucht, ChatGPT in den Rückspiegel zu rücken

Was du wissen musst

Was ist Google Gemini?

Leave a Reply Cancel reply