Anthropics ChatGPT-Rivale Claude kann jetzt 150.000 Wörter in einer Eingabeaufforderung analysieren


OpenAI-Rivale Anthropic gestartet Claude 2.1 heute. Die neueste Version des ChatGPT-Konkurrenten erweitert sein Kontextfenster auf 200.000 Token, sodass Sie das gesamte Homer-Token einfügen können Die Odyssee zur KI-Analyse. (Tokens sind Textblöcke, die zum Organisieren von Informationen verwendet werden, und ein Kontextfenster ist die festgelegte Grenze an Tokens, die in einer einzelnen Anfrage analysiert werden können.) Das Unternehmen sagte, dass Version 2.1 auch Claudes Halluzinationsrate halbiert, was zu weniger fehlerhaften Antworten (wie diesen) führt der ChatGPT-Anwalt hat viel zu sehr vertraut). Zufällig oder nicht, das Update erscheint, während die Tech-Welt zusieht, wie Anthropics Rivale OpenAI in Aufruhr verfällt.

Das Unternehmen gibt an, dass das 200.000-Token-Kontextfenster von Claude 2.1 es Benutzern ermöglicht, ganze Codebasen, wissenschaftliche Arbeiten, Finanzberichte oder lange literarische Werke hochzuladen. (Anthropic sagt, dass 200.000 Token ungefähr 150.000 Wörtern oder über 500 Seiten Material entsprechen.) Nach dem Hochladen des Materials kann der Chatbot Zusammenfassungen bereitstellen, spezifische Fragen zu seinem Inhalt beantworten, mehrere Dokumente vergleichen/gegenüberstellen oder Muster erkennen, die Menschen möglicherweise schwerer tun Sehen.

„Die Verarbeitung einer Nachricht mit einer Länge von 200 KB ist eine komplexe Aufgabe und eine Branchenneuheit“, schrieb das Unternehmen in einem Ankündigungs-Blogbeitrag. „Obwohl wir uns freuen, diese leistungsstarke neue Funktion unseren Benutzern zur Verfügung zu stellen, kann Claude für die Erledigung von Aufgaben, für deren Erledigung normalerweise stundenlanger menschlicher Aufwand erforderlich wäre, einige Minuten in Anspruch nehmen. Wir gehen davon aus, dass die Latenz mit fortschreitender Technologie erheblich sinken wird.“

Anthropic warnt davor, dass die Analyse und Beantwortung extrem langer Eingaben durch den KI-Bot einige Minuten in Anspruch nehmen könnte – deutlich länger als die Sekunden, die wir normalerweise auf einfachere Abfragen warten müssen. „Wir gehen davon aus, dass die Latenz mit fortschreitender Technologie erheblich abnehmen wird“, schrieb das Unternehmen.

Halluzinationen oder selbstbewusst ungenaue Informationen sind in dieser Generation von KI-Chatbots immer noch weit verbreitet. Allerdings sagt Anthropic, dass Claude 2.1 die Halluzinationsrate im Vergleich zu Claude 2.0 halbiert hat. Das Unternehmen führt einen Teil des Fortschritts auf eine verbesserte Fähigkeit zurück, falsche Behauptungen von Eingeständnissen von Unsicherheit zu unterscheiden, wodurch die Wahrscheinlichkeit, dass Claude 2.1 zugibt, keine Antwort zu kennen, etwa doppelt so hoch ist, anstatt eine falsche Antwort zu geben.

Laut Anthropic begeht Claude 2.1 außerdem 30 Prozent weniger Fehler in extrem langen Dokumenten. Darüber hinaus ist die Rate der „irrtümlichen Schlussfolgerung, dass ein Dokument eine bestimmte Behauptung stützt“ drei- bis viermal geringer, wenn robustere Kontextfenster verwendet werden.

Der aktualisierte Bot bietet auch einige Vorteile speziell für Entwickler. Eine neue Workbench-Konsole ermöglicht es Entwicklern, Eingabeaufforderungen „in einem Spielplatz-ähnlichen Erlebnis zu verfeinern und auf neue Modelleinstellungen zuzugreifen, um Claudes Verhalten zu optimieren“. Beispielsweise können Benutzer damit mehrere Eingabeaufforderungen testen und auf Claudes Codebasis zugreifen, um Snippets für SDKs zu generieren. Eine weitere neue Beta-Funktion für Entwickler, „Tool-Verwendung“, ermöglicht Claude „die Integration in die vorhandenen Prozesse, Produkte und APIs der Benutzer“. Das Unternehmen nennt Beispiele wie die Verwendung eines Taschenrechners für komplexe Gleichungen, die Übersetzung einfacher Sprache in strukturierte API-Aufrufe, die Verwendung einer Websuch-API, die Nutzung privater APIs von Kunden oder die Verbindung zu Produktdatensätzen. Das Unternehmen weist darauf hin, dass sich die Tool-Nutzungsfunktion in der frühen Entwicklungsphase befindet, und fordert Kunden dringend auf, Feedback zu geben.

source-115

Leave a Reply