Bei PC Gamer dreht sich alles um zugängliche Technologie. Wenn Sie mich fragen, ist alles, was das Gefühl der Isolation nach ein paar langen Jahren lindern kann, eine willkommene Bereicherung. Kein Wunder also Tom Pritsky ist auf TikTok viral gegangen mit einem kleinen AR-Gerät, das Ihre Gespräche in Echtzeit transkribiert. Sozusagen echte Untertitel.
Pritsky wurde zusammen mit Mitbegründer Madhav Lavakare gegründet TranscribeGlass im Jahr 2021, sodass gehörlose und schwerhörige Menschen nicht mehr von den Lippen ablesen mussten.
TranscribeGlass wirbt mit einer ähnlichen Funktion wie die, die uns das alte Google Glass bieten wollte, und fügt stattdessen einen kleinen Augmented-Reality-Aufsatz an der Seite einer gewöhnlichen Brille hinzu, der nicht nur die von der Person vor Ihnen gesprochenen Wörter transkribiert, sondern auch schafft es aber geschickt, umliegende Gespräche zu ignorieren, die sonst die Transkription verwirren könnten.
Pritskys Ziel ist mutig: „Hörverlust lösen.“ Er war der Gründer von „Stanfords erstem Club, der sich der Interessenvertretung für Hörverlust widmet“, und es ist klar, dass seine Leidenschaft für Technologie im Laufe seines Studiums parallel zu diesem Unterfangen gewachsen ist und nun hier mit TranscribeGlass zusammentrifft.
Sprechen mit Jason Carman In „Saturday Startup Stories“ sagt er: „Selbst wenn man jemandem das perfekte Hörgerät gibt, kann das kaputte Hörsystem den Ton nicht auflösen, und er klingt extrem verschwommen und schwer zu verstehen.“
Studenten der Stanford University haben Brillen entwickelt, die Sprache für gehörlose Menschen in Echtzeit transkribieren. Toll. Das Produkt heißt TranscribeGlass. pic.twitter.com/uvXVOU7czd27. Juli 2023
Um dieses Problem zu umgehen, präsentiert sein und Lavakares Design dem Träger lediglich die Transkription an der Seite des Bildschirms, sodass er sich auf das Gespräch konzentrieren und gleichzeitig die Person ansehen kann, mit der er spricht.
Ich muss sagen, dass der Bildschirm etwas klein ist und einige längere Wörter in zwei separate Zeilen aufgeteilt sind. Hoffentlich können Sie irgendwann auch den Schriftstil ändern.
Das wirklich Tolle an dem Projekt ist, dass man es in alles integrieren kann. „Unser Ziel ist es, quellenunabhängig zu sein“, sagt Pritsky. „Wir können jede API integrieren: Google Speech, DeepgramMicrosoft”.
Das endgültige Modell ist Open Source und leicht zugänglich und wird voraussichtlich etwa 95 US-Dollar kosten. Die Technologie wird jedes Mal besser, wenn ich sie sehe.
Das sollten Sie auf jeden Fall im Auge behalten, wenn Sie zu den Menschen gehören, die sich für Dinge wie haptische Anzüge begeistern, die gehörlosen Konzertbesuchern die Möglichkeit geben, Musik zu erleben.