Meta veröffentlicht KI, um Dutzende Sprachen mithilfe von Sprache und Text zu übersetzen


Meta brauchte eine Schritt in Richtung eines universellen Sprachübersetzers macht das Unternehmen am Dienstag mit der Veröffentlichung seines neuen AI-Modells Seamless M4T, das nach Angaben des Unternehmens schnell und effizient Sprache aus Sprache oder Text in bis zu 100 Sprachen verstehen und Übersetzungen in beiden Kommunikationsarten generieren kann. Mehrere Technologieunternehmen haben ähnliche veröffentlichtin den letzten Monaten weiterentwickelte KI-Übersetzungsmodelle.

In einem BlogeintragMeta beschreibt sein neues Übersetzungssystem als „das erste umfassende multimodale und mehrsprachige KI-Übersetzungsmodell“, das Spracherkennung und Sprache-zu-Text-Übersetzung für fast 100 verschiedene Sprachen ermöglicht. Das Modell kann außerdem Sprache und Text interpretieren und übersetzte gesprochene Wörter für 36 bzw. 35 Sprachen ausspucken. Berichten zufolge kann Seamless M4T auch verstehen, wenn Benutzer mitten im Satz die Sprache wechseln, was bei der Verwendung eines Modells zur Übersetzung von Personen hilfreich sein könnte, die beim Sprechen Teile von Sprachen miteinander vermischen, was Sprachforscher als Codeswitching bezeichnen.

„SeamlessM4T ist ein einheitliches mehrsprachiges Modell, das heißt, es ist nicht auf Zwischenmodelle angewiesen, um Ergebnisse zu erzielen“, sagte Paco Guzmán, Manager für Metaforschung, gegenüber Gizmodo. „Andere kaskadierte Systeme zur gesprochenen Übersetzung tun dies oft: Spracherkennung, Textübersetzung, Text-zu-Sprache-Erzeugung. SeamlessM4T erledigt das in einem Rutsch.“

In einer Videodemo sprach Guzmán den Satz „Unser Ziel ist es, eine vernetztere Welt zu schaffen.“ Das Modell erkannte schnell, dass die gesprochene Sprache Englisch war und übersetzte diese dann ins Russische. Eine computerisierte russische Stimme spuckte den Satz mit mehr oder weniger menschlichem Timbre aus.

Im Gegensatz zu anderen früheren Übersetzungsmodellen verwendet SeamlessM4T ein einziges System, was nach Ansicht von Meta letztendlich zu weniger Fehlern und Verzögerungen sowie einer höheren Qualität führen wird. Meta verglich diesen All-in-One-Übersetzeransatz mit dem Universalübersetzer Babel Fish Per Anhalter durch die Galaxis. Im Moment müssen Sie das nicht tun steck dir das ins Ohr.

Meta veröffentlicht Seamless M4TT unter einer Creative Commons-Lizenz, damit andere Übersetzer und KI-Forscher darauf aufbauen können. Das Unternehmen veröffentlicht außerdem die Metadaten von SeamlessAlign, die über 270.000 Stunden extrahierter Sprache und Text enthalten. Meta behauptet, es sei der größte Datensatz seiner Art.

Obwohl viele neue KI in den letzten Monaten darauf hingewiesen haben Unzuverlässigkeit bei der Verwendung großer Sprachmodelle für die genaue Lieferung SachinformationenSprachübersetzung ist etwas, was diese Modelle tatsächlich gut können-Passend für. Seamless M4T wird durch Metas frühere Iterationen in Übersetzungsmodellen ermöglicht. Einer von ihnen hat Neuland betreten erfolgreich die hauptsächlich gesprochene Sprache Hokkien in gesprochene Wörter übersetzen, eine Premiere für ein neues Modell. Vor kurzem veröffentlichte das Unternehmen seine Massiv mehrsprachige Sprache System, Diese Meta-Ansprüche können eine automatische Spracherkennung und Spracherkennung für mehr als 1.100 Sprachen ermöglichen.

source-113

Leave a Reply