Deasie möchte Daten bewerten und filtern, um generative KI zuverlässiger zu machen


Deasieein Startup, das Tools entwickelt, um Unternehmen eine bessere Kontrolle über textgenerierende KI-Modelle zu geben, gab heute bekannt, dass es in einer Startfinanzierungsrunde unter Beteiligung von Y Combinator, General Catalyst, RTP Global, Rebel Fund und J12 Ventures 2,9 Millionen US-Dollar gesammelt hat.

Die Gründer von Deasie, Reece Griffiths, Mikko Peiponen und Leo Platzer, haben zuvor gemeinsam bei McKinsey Data-Governance-Tools entwickelt. Während ihrer Zeit bei McKinsey sagten sie, sie hätten „erhebliche Probleme“ – und Chancen – im Zusammenhang mit der Verwaltung von Unternehmensdaten beobachtet und konkrete Möglichkeiten, wie sich diese Probleme auf die Fähigkeit eines Unternehmens auswirken könnten, generative KI einzuführen.

Sie sind nicht die Einzigen. Ein aktueller IDC Umfrage Von über 900 Führungskräften großer Unternehmen fanden 86 % der Meinung, dass mehr Governance erforderlich ist, um die „Qualität und Integrität“ generativer KI-Erkenntnisse sicherzustellen. Lediglich 30 % der Befragten der Umfrage gaben an, dass sie sich heute „extrem vorbereitet oder bereit“ fühlten, generative KI zu nutzen.

Um generative KI-Modelle – insbesondere Large Language Models (LLM) nach dem Vorbild von GPT-4 von OpenAI – zuverlässiger zu machen, hat das Deasie-Team ein Produkt entwickelt, das eine Verbindung zu unstrukturierten Unternehmensdaten wie Dokumenten, Berichten und E-Mails herstellt, um diese automatisch zu kategorisieren hinsichtlich ihres Inhalts und ihrer Sensibilität.

Beispielsweise könnte Deasie einen Bericht automatisch mit „persönlich identifizierbaren Informationen“ oder „geschützten Informationen“ kennzeichnen und angeben, dass es sich um die dritte Version des Berichts handelt. Oder es markiert ein Datenblatt mit „Geschützte Informationen“ und weist darauf hin, dass für das Datenblatt eingeschränkte Zugriffsrechte gelten. Deasie-Kunden definieren die Tags und Labels, um ihren Ansatz zur Klassifizierung und Organisation von Daten widerzuspiegeln, teilte Griffiths TechCrunch per E-Mail mit, wodurch die Algorithmen von Deasie „beigebracht“ werden, wie zukünftige Daten zu klassifizieren sind.

Nachdem Deasie Dokumente automatisch mit Tags versehen hat, durchsucht die Plattform die resultierende Tag-Bibliothek, um die entsprechenden Daten im Hinblick auf ihre Gesamtrelevanz und Wichtigkeit zu bewerten. Basierend auf dieser Bewertung wird dann eine Entscheidung darüber getroffen, welche Daten einem textgenerierenden Modell „gefüttert“ werden sollen.

„Unternehmen verfügen über enorme Mengen unstrukturierter Daten, die aus Governance-Sicht kaum Beachtung gefunden haben.“ Griffiths sagte. „Die Wahrscheinlichkeit, dass Sprachmodelle Antworten abrufen, die keinen Sinn ergeben oder vertrauliche Informationen enthalten, steigt mit der Datenmenge. Deasie ist eine intelligente Plattform, die Tausende von Dokumenten im gesamten Unternehmen filtert und sicherstellt, dass die Daten, die in generative KI-Anwendungen eingespeist werden, relevant, hochwertig und sicher zu verwenden sind.“

Deasie ist zweifellos eine faszinierende Plattform. Die Idee, ein LLM auf geprüfte Daten zu beschränken, ist nicht schlecht – insbesondere angesichts der Konsequenzen, wenn man LLMs den Zugriff auf veraltete und widersprüchliche Informationen überlässt. Aber ich frage mich, wie konsistent die Algorithmen von Deasie Daten klassifizieren und wie oft die Plattform Fehler macht, wenn sie die Bedeutung eines Dokuments einschätzt.

Was auch immer die Demo von Deasie sein mag, die Unternehmen müssen diese Fragen zumindest teilweise zu ihrer Zufriedenheit beantworten. Laut Griffiths hat Deasie – das nur drei Mitarbeiter hat – eine Vereinbarung für sein erstes Pilotprojekt mit einem „Multimilliarden-Dollar“-Unternehmen in den USA unterzeichnet und verfügt über eine Pipeline von über 30 Unternehmenskunden, darunter fünf Fortune-500-Unternehmen.

„Andere Produkte haben sich entweder ausschließlich auf den Aspekt ‚Datensicherheit‘ oder den Aspekt ‚Daten-Governance für strukturierte Daten‘ der LLM-Governance konzentriert“, sagte Deasie. „Was es nicht gab, war ein guter Ansatz zur Messung der Datenqualität und Relevanz für unstrukturierte Daten … N.“obody löste direkt das Problem, jeden Anwendungsfall generativer KI mit dem „bestmöglichen“ Datensatz abzugleichen. Deasie hat in diesem Bereich neuartige Ansätze entwickelt.“

In den nächsten Monaten plant Deasie, sein Engineering-Team zu vergrößern und „mehrere Einstellungen“ vorzunehmen, wobei der Schwerpunkt auf der Entwicklung von Funktionen liegt, um sich von Konkurrenten wie Unstructured.io, Scale AI, Collibra und Alation abzuheben.

source-116

Leave a Reply