Das Synthetik-Speech-Startup Murf verleiht Inhaltserstellern jeder Größe eine Stimme


Synthetisches Sprachtechnologie-Startup Murf gibt Inhaltserstellern jeder Größe buchstäblich eine Stimme. Murf, das jetzt über eine Bibliothek mit mehr als 120 KI-Stimmen mit menschlicher Parität in 20 Sprachen verfügt, gab heute bekannt, dass es 10 Millionen US-Dollar an Finanzierungen der Serie A unter der Leitung von Matrix-Partnern gesammelt hat. Die Beteiligung kam von wiederkehrenden Investoren Elevation Capital und mehreren prominenten Angel-Investoren wie Ola-Gründer Ankit Bhai; Disney Streaming SVP des Produkts; Ashwini Asokan, der Gründer von Mad Street Dap; und Pushkar Mukewar, Gründer von Drip Capital

Murf wurde im Oktober 2020 von den IIT-Kharagpur-Schulfreunden Sneha Roy, Ankur Edkie und Divyanshu Pandey gegründet. Die vorherige Finanzierungsankündigung von Murf war ein Startkapital in Höhe von 1,5 Millionen US-Dollar, angeführt von Elevation Capital und Angel-Investoren, die ihnen dabei halfen, Talente zu rekrutieren, in Produktinnovationen und Benutzerakquise zu investieren. Murf sagt, dass es seit seiner Seed-Runde in ARR um das 26-fache gewachsen ist und mehr als eine Million Voice-Over-Projekte in einer Vielzahl von Sprechstilen und Tönen synthetisiert hat.

Einige Beispiele dafür, wie Murfs Technologie verwendet wurde, sind ein Tech-Unternehmer und Künstler, der einen ganzen Film mit KI-Kunstmodellen, Deep-Fake-Programmen und KI-Stimmen aus dem Murf-Studio erstellt hat; eine Unterhaltungsanimationsagentur, die eine Fernsehserie mit einer Sammlung von Murfs Stimmen erstellt hat; Autoren, die Fantasy-Fiction-Hörbücher mit Murfs KI-Stimmen erstellen; und ein YouTube-Influencer, der Murfs KI-Stimme verwendet hat, um ein Rap-Video zu erstellen.

Murfs Gründer

Murfs Gründer

Edkie, der CEO von Murf, sagte gegenüber TechCrunch, dass, obwohl das Gründungsteam von Murf in der Vergangenheit in verschiedenen Bereichen gearbeitet hatte, sie alle auf die Schmerzpunkte bei der Erstellung hochwertiger Voice-Overs stießen. Dazu gehörte das Erstellen und Aktualisieren von Produktdemos und das Aufzeichnen von Radio- und Videowerbung. Er fügte hinzu, dass die Pandemie „der Multimedia-Erstellung einen Schub verliehen habe und die Nachfrage nach skalierbaren Audioinhalten schnell wachse“.

Murfs Kunden haben es auf vielfältige Weise genutzt, darunter Werbung, Hörbücher, Erklärvideos und E-Learning. Murf.ai, seine SaaS-Plattform, wurde entwickelt, um es Kunden zu erleichtern, qualitativ hochwertige, natürlich klingende Voiceovers für kommerzielle Zwecke zu erstellen. Die Größe der Kunden des Unternehmens reicht von einzelnen Erstellern von Inhalten bis hin zu SMBS und Unternehmen und arbeitet in Sektoren wie Bildung, Unternehmen, Gesundheitswesen, Medien und Unterhaltung, Marketing, Werbung, Podcasting, Kundenbetreuung und mehr.

Edkie, sagte gegenüber TechCrunch, dass Inhaltsersteller und Marketingteams Voiceovers oft selbst aufnehmen oder den gesamten Prozess auslagern, was beides „umständlich, teuer und zeitaufwändig“ sei. Murf hingegen ermöglicht es Benutzern, „menschliche“ Voiceovers zu erzeugen, ohne Aufnahmegeräte kaufen oder einen Sprecher engagieren zu müssen.

Das Unternehmen möchte auch Einschränkungen für die Möglichkeiten von Text-to-Speech aufheben. „Obwohl es TTS schon seit geraumer Zeit gibt, haben Einschränkungen in der Sprachqualität seine Nutzung eingeschränkt. Durch die Nutzung der jüngsten Fortschritte in den Bereichen KI und Deep Learning ermöglichen wir es, synthetische High-Fidelity-Stimmen zu erstellen, die die natürliche Prosodie und Aussprache der menschlichen Sprache nachahmen.“

Die Plattform von Murf umfasst ein KI-fähiges SaaS-Tool, das Benutzern hilft, „menschenähnliche“ Stimmen zu erzeugen, typischerweise für die Verwendung in Videos oder Präsentationen, ohne komplexe und kostspielige Aufnahmegeräte beschaffen oder einen Sprecher einstellen zu müssen. Ersteller von Inhalten können eine Online-Sprachaufzeichnungskabine nutzen, in der sie eine breite Palette von Sprechstilen ausprobieren können. Murf möchte die Vielfaltslücke in traditionellen Text-to-Speech-Plattformen schließen, indem er Stimmen mit unterschiedlichen Akzenten wie Afroamerikanern, Briten, Australiern und anderen einbezieht.

Laut Marktberichten der Murf-Gründer wird der globale Text-Sprache-Markt bis 2028 voraussichtlich 7,06 Milliarden US-Dollar erreichen und um 14,6 % CAG wachsen. Unterdessen sollen die Voiceover- und Synchronisationsmärkte bis 2027 jährlich insgesamt 8 Milliarden US-Dollar erwirtschaften.

Text-to-Speech gibt es schon seit Jahren, aber aufgrund von Qualitätseinschränkungen wurden sie hauptsächlich von Sprachassistenten und Chatbots verwendet. Aber die jüngsten Entwicklungen in der KI und im Deep Learning bedeuten, dass es jetzt möglich ist, synthetische Stimmen zu erzeugen, die die Prosodie und Aussprache der menschlichen Sprache haben. Die KI-Engine von Murf wird mit stundenlanger menschlicher Sprache trainiert, und die Murf Studios bieten mehr als 120 menschliche KI-Stimmen, die in 20 Sprachen sprechen können. Murf arbeitet auch daran, vielfältigere Akzente zu setzen, indem er mit Synchronsprechern zusammenarbeitet, um Stimmen wie afroamerikanisches, britisches und australisches Englisch ins Ausland zu bringen.

Murfs KI-gestütztes Text-to-Speech kann auch aus Kontextinformationen lernen, um die richtigen Antworten zurückzugeben. Die Gründer beschreiben Murf als „All-in-One-Voice-Lösung“, mit der Benutzer Bilder, Videos und Hintergrundmusik hinzufügen können. Es hat auch Funktionen für die Aussprache unter Verwendung des internationalen phonetischen Alphabets (IPA), Sprachanpassungen, die die Tonhöhe, Pause, Betonung und Geschwindigkeit des Benutzers ändern.

Murf verdient Geld durch einen Abonnementplan für seine Dienste. Es kam aus dem Beta-Test im Januar 2021 und ist in den letzten 18 Monaten in der ARR um das 22-fache gewachsen und hat bis heute über eine Million Voiceover-Projekte synthetisiert.

Edkie sagte, dass die Hauptkonkurrenten von Murf die großen Technologie- und Cloud-Unternehmen wie Google, Amazon, Polly und Microsoft sind, die die führenden Text-to-Speech-Plattformen auf dem Markt haben. Murf zeichnet sich durch natürlich klingende KI-Stimmen aus, die auch mehrere Akzente und Stile unterstützen.

„Unsere Plattform geht über ein einfaches Text-to-Speech-Tool hinaus und bietet Benutzern die Möglichkeit, Bilder, Videos, Präsentationen und Voiceover hinzuzufügen, Hintergrundmusik einzufügen und sie zusammen zu synchronisieren, um überzeugende Inhalte zu erstellen“, sagte Edkie. Murfs KI-gestütztes TTS kann auch aus großen Mengen kontextbezogener Informationen lernen, um kontextbezogene Sprache zu erstellen. Zum Beispiel verfügt es über ein integriertes Kontextbewusstsein, das häufig verwendete Entitätsformate wie Zahlen, Währungen, Prozentsätze, Adressen, Daten und Uhrzeiten erkennen kann, ihre Zufälligkeit reduziert und sie einem vordefinierten Standard näher bringt, fügte Edkie hinzu.

In einer vorbereiteten Erklärung sagte der Co-Geschäftsführer von Elevation Capital, Mukul Arora: „KI-gesteuerte, lebensechte Voiceovers sind die nächste Grenze im Text-to-Speech-Markt. Murf ist mit seinem herausragenden Gründungsteam und seiner einzigartigen IP perfekt gerüstet, um in diesem Bereich eine Führungsposition einzunehmen. Ihre Umsetzungsstärke und ihr technologieorientierter Fokus zeigen sich in der soliden Traktion und dem Wachstum, das sie bisher gezeigt haben. Wir freuen uns sehr, unsere Partnerschaft mit Murf zu verdoppeln.“

source-116

Leave a Reply