Krisp erweitert sich von der Geräuschunterdrückung zur Transkription auf dem Gerät


Krisp begann als KI-gestützter Geräuschunterdrückungsdienst, aber jetzt geht das Startup mit der sofortigen Transkription aller Ihrer Anrufe und Besprechungen auf dem Gerät darüber hinaus – und natürlich integriert es jetzt auch ChatGPT für schnelle Zusammenfassungen. Die offene Beta geht heute live.

Meine Transkriptionserfahrung besteht normalerweise darin, das mit einem Meeting verbundene Video oder Audio herunterzuladen, vorausgesetzt, jemand dachte daran, es aufzuzeichnen (und ich weiß, wer dieser jemand war), und dann diese Datei auf einen Dienst wie Otter hochzuladen und 10 bis 15 Minuten zu warten es verarbeitet. Im Vergleich zu noch vor wenigen Jahren ist das natürlich sehr bequem, aber die Zahl der Online-Meetings hat sich vervielfacht. Überall dort, wo ich ein paar Minuten oder Klicks von meinem Workflow sparen kann, bin ich normalerweise interessiert.

Krisp hat im Laufe der Jahre auch eine gewisse Zielstrebigkeit gezeigt und sich auf eine effektive Geräuschunterdrückung bei vielen Geräten und Diensten konzentriert. Der Fortschritt, der dies ermöglichte, bestand im Wesentlichen darin, das System darauf zu trainieren, menschliche Stimmen zu erkennen und zu isolieren, die zwar vielfältig sind, sich aber auch deutlich unterscheiden und sich stark von Hundegebell, Verkehrslärm und so weiter unterscheiden. Für mich hat Krisp im Allgemeinen einfach funktioniert.

Als sie mir also sagten, dass sie in die Transkription einsteigen würden, war ich froh, das zu hören: Es ist eine natürliche Erweiterung einer sprachorientierten Plattform, und natürlich wissen sie, dass sie ein sauberes Sprachsignal erhalten können.

Krisp arbeitet bereits mehr oder weniger hinter den Kulissen und fungiert als Passthrough für Audioquellen. Es besteht also keine Notwendigkeit für die „KI-Meeting-Assistent“ um sich in Google, Teams, Zoom oder irgendetwas anderes zu integrieren oder ein Phantomteilnehmer zu sein – es befasst sich ausschließlich mit Ihrem Audiosignal, bevor es ausgeht oder bevor ihr Signal auf Ihre Ohren trifft. Der Transkriptionsagent muss nicht mit Diensten oder APIs kommunizieren, er identifiziert lediglich ein- und ausgehende Stimmen und transkribiert sie auf Ihrem Gerät.

Die Transkription auf dem Gerät ist ein wichtiges Unterscheidungsmerkmal, zum einen, weil sie einfacher ist als der Umgang mit Audiodateien, und zum anderen, weil der Ton Ihres Meetings Ihren Computer nie verlässt. Ich bin mir nicht sicher, für welche Bedrohungsmodelle das wichtig ist, aber ich vermute, dass sie existieren und in den kommenden Jahren nur noch an Bedeutung gewinnen werden.

Das Transkript selbst wird direkt an den Cloud-Dienst von Krisp gesendet, was den Sicherheitsvorteil der Transkription auf dem Gerät in gewisser Weise zunichte macht. Aber wenn Sie bereit sind, einem anderen Transkriptor zu vertrauen, warum nicht diesem? Und wie auch immer, es wird bald auch eine Option geben, Ihre Transkripte vollständig auf dem Gerät zu behalten. Davit Baghdasaryan, CEO und Mitbegründer von Krisp, hat einen umfassenden Sicherheitshintergrund und sagte, er freue sich darauf, dies umzusetzen. (Ich vermute, es ist einfach einfacher, eine Web-App zu erstellen, als mehreren Mobil- und Desktop-Apps wichtige neue Funktionen hinzuzufügen.)

Und wie sind die Abschriften? Meiner Erfahrung nach ungefähr so ​​gut wie andere KI-betriebene, das heißt besser als meine Notizen, aber noch nicht ganz bereit für die Veröffentlichung. Wenn Sie das Audio sofort löschen, wird eine nützliche Funktion anderer Transkriptoren, die schnelle Überprüfung und Bearbeitung, zunichte gemacht: Klicken Sie auf ein verdächtiges Wort, und es springt an diese Stelle im Audio. Zumindest für den Moment, in Interviews, in denen Sie genau und ausführlich zitieren müssen, ist dies möglicherweise nicht die beste Wahl.

Aber Krisp positioniert dies eher als Produktivitätstool und baut eine Plattform für die schnelle Extraktion wichtiger Punkte aus den unzähligen Meetings auf, die wir manchmal planen. Zu diesem Zweck ermöglicht Ihnen das Unternehmen, das Transkript schnell zur Analyse an ChatGPT einzusenden, das die TL;DR, zugewiesenen Aktionen oder was auch immer sonst aus dem Meeting gezogen werden muss, herauszieht.

Ehrlich gesagt, ich habe diese Funktionen nie gemocht und benutze sie nie, daher kann ich hier nicht über die Qualität sprechen. Sie sind wahrscheinlich so gut wie jeder andere Dienst, der dies tut, was bedeutet, dass sie für die Leute nützlich sind, die solche Dinge nützlich finden. Ich versuche, den Inhalt eines Meetings so schnell wie möglich zu vergessen, zweifellos zum Leidwesen meiner Kollegen – aber zu meiner Verteidigung, ich würde mich einfach falsch daran erinnern. Organisierte Personen, die Prozesse für diese Art von Arbeit haben, können feststellen, dass der Krisp-Stil für sie gut funktioniert oder nicht.

Ich zögere auch, einen Dienst zu beurteilen, der im Wesentlichen ein API-Aufruf zu einem anderen Dienst ist, der sich selbst ständig ändert. Mit der Verbesserung von ChatGPT werden sich auch die Apps verbessern, die darauf angewiesen sind – genauso wie auf hundert anderen Plattformen, die plötzlich eine Fähigkeit zum Verstehen natürlicher Sprache entwickelt haben.

Krisp ist kostenlos, wenn Sie es ausprobieren möchten – das Unternehmen verdient Geld mit Premium-Abonnements für Unternehmen, und natürlich ist es mit der auf Ihrem Gerät laufenden Berechnung ganz einfach zu skalieren.

Es lohnt sich, sich auf Ihrem Mac oder PC einen Moment Zeit zu nehmen, um sicherzustellen, dass er richtig konfiguriert ist, was bedeutet, dass sein Passthrough wie beabsichtigt funktioniert. Ich hatte schon früh einige seltsame Probleme, habe sie aber behoben, indem ich bei Null angefangen und nur Meeting-Apps und Mikrofone zugewiesen habe, um Krisp zu durchlaufen, damit meine Musik nicht heruntergemischt wird. Es sind nur eine Handvoll Wählscheiben und Schalter, also nehmen Sie sich fünf Minuten Zeit, um es richtig zu machen, und bald werden Ihre Transkripte so schnell erscheinen, dass es ziemlich nervig sein wird.

source-116

Leave a Reply