Deepgram erwirbt neues Geld, um sein Geschäft mit Spracherkennung für Unternehmen auszubauen


Deepgram, ein Unternehmen, das Spracherkennungstechnologie für Unternehmen entwickelt, hat heute 47 Millionen US-Dollar an neuen Finanzmitteln unter der Leitung der Madrona Venture Group mit Beteiligung von Citi Ventures und Alkeon aufgebracht. Eine Erweiterung von Deepgrams Serie B, die im Februar 2021 unter der Leitung von Tiger Global startete, bringt das Start-up insgesamt auf 86 Millionen US-Dollar, die laut CEO Scott Stephenson in die Forschung und Entwicklung in Bereichen wie Emotionserkennung, Absichtserkennung, Zusammenfassung und Thema gesteckt werden Erkennung, Übersetzung und Redaktion.

„Wir freuen uns, dass Deepgram trotz der herausfordernden Marktbedingungen seine bisher höchste Pre- und Post-Money-Bewertung erreicht hat“, sagte Stephenson in einem E-Mail-Interview mit TechCrunch. (Leider wollte er die genaue Bewertung nicht preisgeben.) „Wir glauben, dass Deepgram in einer starken Position ist, um in diesem schwierigeren makroökonomischen Umfeld erfolgreich zu sein. Die Sprach-KI von Deepgram ist die Kerntechnologie hinter vielen Anwendungen unserer Kunden, und die Nachfrage nach Sprachverständnis wächst, da Unternehmen nach mehr Effizienz streben.“

Deepgram wurde 2015 eingeführt und konzentriert sich auf die Entwicklung benutzerdefinierter Spracherkennungslösungen für Kunden wie Spotify, Auth0 und sogar die NASA. Die Datenwissenschaftler des Unternehmens beschaffen, erstellen, kennzeichnen und bewerten Sprachdaten, um Spracherkennungsmodelle zu erstellen, die Marken und Jargon verstehen, eine Reihe von Sprachen und Akzenten erfassen und sich an anspruchsvolle Audioumgebungen anpassen können. Beispielsweise baute Deepgram für die NASA ein Modell, um die Kommunikation zwischen Mission Control und der Internationalen Raumstation zu transkribieren.

„Audiodaten sind eine der größten unerschlossenen Datenquellen der Welt. [But] Es ist schwierig, es in seinem Audioformat zu verwenden, da Audio ein unstrukturierter Datentyp ist und daher nicht ohne weitere Verarbeitung gewonnen werden kann“, sagte Stephenson. „Deepgram nimmt unstrukturierte Audiodaten und strukturiert sie als Text und Metadaten mit hoher Geschwindigkeit und niedrigen Kosten, die für den Unternehmensmaßstab ausgelegt sind … [W]mit Deepgram, [companies] können alle Audiodaten ihrer Kunden – Hunderttausende oder Millionen von Stunden – zur Transkription und Analyse senden.“

Woher kommen die Audiodaten zum Trainieren der Deepgram-Modelle? Stephenson war da etwas schüchtern, obwohl er nicht leugnete, dass Deepgram Kundendaten verwendet, um seine Systeme zu verbessern. Er wies schnell darauf hin, dass das Unternehmen die DSGVO einhält und Benutzer jederzeit die Löschung ihrer Daten verlangen können.

„Die Modelle von Deepgram werden in erster Linie anhand von Daten trainiert, die von unseren Datenpflegeexperten gesammelt oder generiert wurden, neben einigen anonymisierten Daten, die von unseren Benutzern übermittelt wurden“, sagte Stephenson. „Das Trainieren von Modellen anhand realer Daten ist ein Eckpfeiler der Qualität unseres Produkts. Es ermöglicht maschinellen Lernsystemen wie unserem, menschenähnliche Ergebnisse zu erzielen. Allerdings ermöglichen wir unseren Benutzern, die Verwendung ihrer anonymisierten Daten für Schulungen abzulehnen, wenn sie dies wünschen.“

Über die API von Deepgram können Unternehmen die Plattform in ihre Tech-Stacks einbauen, um sprachbasierte Automatisierungen und Kundenerlebnisse zu ermöglichen. Für Organisationen in stark regulierten Sektoren, wie dem Gesundheitswesen und der Regierung, bietet Deepgram eine On-Premises-Bereitstellungsoption, die es Kunden ermöglicht, Daten lokal zu verwalten und zu verarbeiten. (Bemerkenswert ist, dass In-Q-Tel, der strategische Investitionsarm der CIA, Deepgram in der Vergangenheit unterstützt hat.)

Deepgram – ein Y Combinator-Absolvent, der von Stephenson und Noah Shutty, einem Physik-Absolventen der University of Michigan, gegründet wurde – konkurriert mit einer Reihe von Anbietern auf einem Markt für Spracherkennung, der bis 2030 einen Wert von 48,8 Milliarden US-Dollar haben könnte. gemäß zu einer (optimistischen?) Quelle. Tech-Giganten wie Nuance, Cisco, Google, Microsoft und Amazon bieten Sprachtranskriptions- und Untertitelungsdienste in Echtzeit an, ebenso wie Startups wie Otter, Speechmatics, Voicera und Verbit.

Die Technik hat Hürden zu überwinden. Laut einem 2022 Bericht Laut Speechmatics haben 29 % der Führungskräfte KI-Voreingenommenheit bei Sprachtechnologien beobachtet – insbesondere Ungleichgewichte bei den Arten von Stimmen, die von der Spracherkennung verstanden werden. Aber die Nachfrage ist offensichtlich stark genug, um die Palette der Anbieter da draußen zu stützen; Stephenson behauptet, dass Deepgram’s Bruttomarge sind „auf einer Linie mit leistungsstarken Softwareunternehmen“.

Das steht im Gegensatz zum Verbraucher-Spracherkennungsmarkt, der sich in letzter Zeit zum Schlechteren gewendet hat. Amazons Alexa Aufteilung ist Berichten zufolge auf dem besten Weg, dieses Jahr 10 Milliarden Dollar zu verlieren. Und Google ist gemunkelt Kürzungen bei der Entwicklung von Google Assistant zugunsten profitablerer Projekte ins Auge zu fassen.

In den letzten Monaten, sagt Stephenson, lag der Fokus von Deepgram auf der spontanen Sprachübersetzung, Stimmungsanalyse und geteilten Transkriptionen von Mehrwegegesprächen. Das Unternehmen wächst ebenfalls und erreicht nun über 300 Kunden und mehr als 15.000 Benutzer.

Auf der Suche nach neuen Geschäften hat Deepgram kürzlich das Deepgram Startup Program gestartet, das Start-ups im Bildungs- und Unternehmensbereich 10 Millionen US-Dollar an kostenlosen Spracherkennungskrediten auf der Deepgram-Plattform bietet. Die teilnehmenden Unternehmen müssen keinerlei Gebühren zahlen und können die Mittel in Verbindung mit bestehenden Zuschüssen, Seed-, Inkubator- und Accelerator-Vorteilen verwenden.

„Das Geschäft von Deepgram wächst weiterhin schnell. Als grundlegendes Unternehmen für KI-Infrastruktur haben wir keinen Rückgang der Nachfrage nach Deepgram festgestellt“, sagte Stephenson. „Tatsächlich haben wir beobachtet, wie Unternehmen nach Wegen suchen, um Kosten zu senken und sich wiederholende, niedere Aufgaben an KIs zu delegieren – um den Menschen mehr Zeit für interessante, sinnvolle Aufgaben zu geben. Beispiele hierfür sind die Reduzierung der Rechenkosten für große Clouds durch die Umstellung der großen Cloud-Transkription auf das Transkriptionsprodukt von Deepgram oder in neuen Anwendungsfällen wie Drive-Thru-Bestellungen und Sichtung der ersten Runde von Kundenservice-Antworten.“

Deepgram beschäftigt derzeit 146 Mitarbeiter, die auf Büros in Ann Arbor und San Francisco verteilt sind. Auf die Frage nach Einstellungsplänen für den Rest des Jahres lehnte Stephenson eine Antwort ab – zweifellos in Kenntnis der Unvorhersehbarkeit der aktuellen Weltwirtschaft und der Aussicht, sich auf eine feste Zahl festzulegen.

source-116

Leave a Reply