Laut Anthropic schneidet sein neuer KI-Chatbot Claude 3 bei wichtigen Benchmarks besser ab als GPT-4


Der Kampf zwischen KI-Chatbots ist mehr als ein Zwei-Pferde-Rennen. Anthropic, das von mehreren ehemaligen OpenAI-Mitarbeitern gegründete Unternehmen, behauptet, dass sein neues Claude-3-Sprachmodell ChatGPT und Googles Gemini in mehreren wichtigen Branchen-Benchmarks übertrifft. Bei einigen Aufgaben erreichte das Unternehmen sogar ein „nahezu menschliches“ Niveau schrieb in einem Blog.

Unter dem Dach von Claude 3 gibt es drei neue Chatbots, darunter Haiku, Sonnet und Opus. Sonett treibt das an Claude.ai-Chatbot und wird mit einer E-Mail-Anmeldung kostenlos angeboten. Mittlerweile ist Opus das größte und leistungsstärkste LLM und wird mit einem Abonnement von 20 US-Dollar pro Monat über den „Claude Pro“-Dienst erhältlich sein. Es ist außerdem multimodal, sodass es im Gegensatz zu früheren Versionen sowohl mit Text- als auch mit Bildeingaben arbeiten kann.

Alle Claude 3-Modelle „können Live-Kundenchats, automatische Vervollständigungen und Datenextraktionsaufgaben unterstützen, bei denen Antworten sofort und in Echtzeit erfolgen müssen“, sagte das Unternehmen. Sie versprechen nicht nur „nahezu sofortige Ergebnisse“, sondern können auch längere, mehrstufige Anweisungen mit erhöhter Genauigkeit verarbeiten.

Laut Anthropic schneidet sein neuer KI-Chatbot Claude 3 bei wichtigen Benchmarks besser ab als GPT-4Laut Anthropic schneidet sein neuer KI-Chatbot Claude 3 bei wichtigen Benchmarks besser ab als GPT-4

Anthropisch

Opus zeigte auf Graduiertenniveau besseres Denken als GPT-4 und erzielte in diesem Test eine um 14,7 Prozent höhere Punktzahl als GPT-4. Es schlug auch den Chatbot von OpenAI bei Aufgaben, die Mathematik, Codierung, logisches Denken und Wissen umfassten.

Sie übertreffen auch frühere Claude-Modelle. „Für die überwiegende Mehrheit der Arbeitslasten ist Sonnet doppelt so schnell wie Claude 2 und Claude 2.1 und weist ein höheres Maß an Intelligenz auf. Es zeichnet sich bei Aufgaben aus, die schnelle Reaktionen erfordern, wie z. B. Wissensabruf oder Verkaufsautomatisierung. Opus bietet ähnliche Geschwindigkeiten wie Claude 2 und 2.1, jedoch.“ mit viel höherer Intelligenz“, so Anthropic.

Mittlerweile ist Haiku, die kleinste Version von Claude 3, „das schnellste und kostengünstigste Modell auf dem Markt“. Zu diesem Zweck ist es in der Lage, eine umfangreiche Forschungsarbeit mit Diagrammen und Grafiken in weniger als drei Sekunden zu lesen.

Das Unternehmen stellte außerdem fest, dass Claude 3 „eine breite Palette visueller Formate verarbeiten kann, darunter Fotos, Diagramme, Grafiken und technische Diagramme“, was Unternehmen hilft, die PDFs, Flussdiagramme oder Präsentationsfolien verwenden. Dank eines differenzierteren Verständnisses von Anfragen wird es auch weniger wahrscheinlich sein, harmlose Inhalte abzulehnen, während gleichzeitig „echter Schaden“ erkannt wird.

Anthropic hat gesagt, dass Claude AI von 10 geheimen Grundpfeilern der Fairness geleitet wird. Claude 3 wurde sowohl für nicht öffentliche interne als auch für öffentlich zugängliche Daten geschult, wobei er Hardware von Amazon Web Services (AWS) und Google Cloud nutzte (Amazon investierte kürzlich 4 Milliarden US-Dollar in Anthropic).

Claude 3 Opus und Claude 3 Sonnet sind ab sofort über die API von Anthropic verfügbar, Haiku soll bald folgen. Sonnet ist auch über Amazon Bedrock und in der privaten Vorschau verfügbar Der Vertex AI Model Garden von Google Cloud.

Dieser Artikel enthält Affiliate-Links; Wenn Sie auf einen solchen Link klicken und einen Kauf tätigen, erhalten wir möglicherweise eine Provision.

source-115

Leave a Reply