Die neuesten Modelle von Writer können Text aus Bildern generieren, einschließlich Diagrammen und Grafiken


Da generative KI weiterhin die Schlagzeilen dominiert, ist es manchmal schwierig, im Hype tatsächlich funktionierende Geschäftsanwendungsfälle zu finden. Schriftsteller ist ein Startup aus San Francisco, das an der Entwicklung generativer KI-Schreibprodukte für Unternehmen arbeitet. Heute kündigte das Unternehmen eine neue Funktion für seine an Palmyra-Modell das aus Bildern Text, einschließlich Grafiken und Diagramme, generiert, nennen sie Palmyra-Vision.

May Habib, Mitbegründerin und CEO des Unternehmens, sagt, dass sie eine strategische Entscheidung getroffen haben, sich auf multimodale Inhalte zu konzentrieren, und dass die Möglichkeit, Texte aus Bildern zu generieren, Teil dieser Strategie ist. „Wir werden uns auf die multimodale Eingabe konzentrieren, aber auf die Textausgabe, also die Textgenerierung und Erkenntnisse, die über Text vermittelt werden“, sagte Habib gegenüber TechCrunch.

Das Unternehmen folgte diesem Leitstern und beschloss, Bilder zu analysieren, statt sie zu produzieren (zumindest vorerst). Sie behält sich das Recht vor, irgendwann Diagramme und Grafiken aus Daten zu erstellen, aber das ist derzeit nichts, was sie tun. Diese spezielle Version konzentriert sich auf die Generierung von Text aus solchen Bildern.

Das Unternehmen verwendet einen Ansatz mit mehreren Modellen, um die Palmyra-Vision-Ergebnisse zu erstellen, wobei jedes Modell eine bestimmte Aufgabe hat, um zu bestimmen, was im Bild enthalten ist, und dann den Text mit einer Genauigkeit von vier Neunen zu generieren, so Habib.

Dies hat eine Reihe von Anwendungsfällen, darunter eine E-Commerce-Website, die Text aus Tausenden sich ändernden Bildern generiert, um die Website mit den neuesten Waren zu füllen, ohne dass ein Mensch mit jeder Änderung Schritt halten muss, oder die automatische Interpretation wichtiger Erkenntnisse aus Diagrammen und Grafiken. Ein weiteres Beispiel ist die Compliance-Prüfung. Beispielsweise könnte ein Pharmaunternehmen Palmyra-Vision verwenden, um eine automatisierte FDA-Compliance-Prüfung des Anzeigentextes durchzuführen und so sicherzustellen, dass die Anzeige den FDA-Vorschriften entspricht, die in einem zugehörigen Dokument beschrieben sind, wie im folgenden Beispiel dargestellt.

Beispiel für den Autor Palmyra Vision für ein Pharmaunternehmen, das die Anzeige anhand eines Dokuments mit FDA-Anforderungen vergleicht.

Palmyra-Vision-Beispiel für ein Pharmaunternehmen, das eine Anzeige anhand eines Dokuments mit FDA-Anforderungen vergleicht. Bildnachweis: Schriftsteller

Schließlich kann das Produkt handschriftliche Notizen interpretieren und in Text zusammenfassen, aber Habib sagt, dass es das Training des Modells für einzelne Anwendungsfälle wie Medizin oder Versicherung erfordert, damit die Genauigkeit vorhanden ist.

Habib sagt, dass sie nicht empfiehlt, diese Tools ohne eine menschliche Überprüfung als Teil des Arbeitsablaufs zu verwenden. Sie glaubt, dass dies absolut notwendig ist, da jedes Model halluzinieren (Dinge erfinden) oder Fakten einfach falsch verstehen kann und es wichtig ist, dass Leute die Ergebnisse überprüfen. Obwohl sie dies immer jedem Kunden empfehlen und die meisten es inzwischen verstehen, ist sie davon überzeugt, dass es irgendwann einen stärker automatisierten Arbeitsablauf erfordern wird, um dies für alle Kunden konsistent zu gewährleisten, worauf sie ihrer Meinung nach hinarbeiten.

Das Unternehmen hat bisher 126 Millionen US-Dollar eingesammelt Crunchbase-Daten, und spricht derzeit mit den großen Cloud-Infrastrukturplattformen über Partnerschaften bei der Skalierung des Unternehmens. Die letzte Runde war eine 100-Millionen-Dollar-Serie-B-Runde im vergangenen September unter der Leitung von Iconiq.

Die neueste Palmyra-Version mit Bild-zu-Text-Funktionen ist ab heute verfügbar.

source-116

Leave a Reply