Steg.AI nutzt Deep Learning in einer cleveren Weiterentwicklung des Wasserzeichens


Ein Bild mit einem Wasserzeichen zu versehen, um es als „Eigentum“ zu kennzeichnen, hat auf unzähligen Domains von Wert, aber heutzutage ist es schwieriger, als nur ein Logo in der Ecke anzubringen. Steg.AI Ermöglicht es Erstellern, mithilfe von Deep Learning ein nahezu unsichtbares Wasserzeichen einzubetten und so den üblichen Gegenmaßnahmen „Größe ändern und neu speichern“ zu entgehen.

Der Besitz digitaler Assets hat einige komplexe Jahre hinter sich, da NFTs und die KI-Generierung einen Bereich aufrüttelten, der zuvor ein eher wenig intensives Feld war. Wenn Sie die Herkunft eines Mediums wirklich nachweisen müssen, gibt es Möglichkeiten, diese Daten in Bilder oder Audio zu kodieren. Diese lassen sich jedoch durch triviale Änderungen wie das Speichern des PNG als JPEG leicht umgehen. Stärkere Wasserzeichen sind in der Regel sichtbar oder hörbar, etwa ein deutlich sichtbares Muster oder Code auf dem Bild.

Ein unsichtbares Wasserzeichen, das leicht angebracht und ebenso leicht erkannt werden kann und das gegenüber Transformation und Neucodierung widerstandsfähig ist, ist etwas, das viele Ersteller nutzen würden. IP-Diebstahl, ob vorsätzlich oder versehentlich, ist online weit verbreitet und die Fähigkeit zu sagen: „Sehen Sie, ich kann beweisen, dass ich das gemacht habe“ – oder dass eine KI es gemacht hat – wird immer wichtiger.

Steg.AI arbeitet seit Jahren an einem Deep-Learning-Ansatz für dieses Problem, wie bewiesen durch dieses CVPR-Papier von 2019 und der Erhalt staatlicher SBIR-Zuschüsse der Phasen I und II. Die Mitbegründer (und Co-Autoren) Eric Wengrowski und Kristin Dana waren zuvor jahrelang in der akademischen Forschung tätig; Dana war Wengrowskis Doktorvater.

Während Wengrowski feststellte, dass sie seit 2019 zwar zahlreiche Fortschritte gemacht haben, zeigt das Papier doch die allgemeine Form ihres Ansatzes.

„Stellen Sie sich vor, ein generatives KI-Unternehmen erstellt ein Bild und Steg versieht es mit einem Wasserzeichen, bevor es es an den Endbenutzer liefert“, schrieb er in einer E-Mail an TechCrunch. „Der Endbenutzer postet das KI-generierte Bild möglicherweise in den sozialen Medien. Kopien des bereitgestellten Bildes enthalten weiterhin das Steg.AI-Wasserzeichen, auch wenn die Größe des Bildes geändert, es komprimiert, ein Screenshot erstellt oder seine herkömmlichen Metadaten gelöscht werden. Steg.AI-Wasserzeichen sind so robust, dass sie von einem elektronischen Display gescannt oder mit einer iPhone-Kamera ausgedruckt werden können.“

Obwohl man verständlicherweise keine genauen Einzelheiten des Prozesses preisgeben wollte, funktioniert er mehr oder weniger so: Anstelle eines statischen Wasserzeichens, das umständlich über ein Medium geschichtet werden muss, verfügt das Unternehmen über ein aufeinander abgestimmtes Paar maschineller Lernmodelle die das Wasserzeichen an das Bild anpassen. Der Kodierungsalgorithmus identifiziert die besten Stellen, an denen das Bild so verändert werden kann, dass die Leute es nicht wahrnehmen, der Dekodierungsalgorithmus sie aber leicht ausfindig machen kann – da er denselben Prozess verwendet, weiß er, wo er suchen muss.

Das Unternehmen beschrieb es als ein bisschen wie einen unsichtbaren und weitgehend unveränderlichen QR-Code, wollte aber nicht sagen, wie viele Daten tatsächlich in ein Medium eingebettet werden können. Wenn es wirklich so etwas wie ein QR-Code ist, kann er ein oder drei Kilobyte haben, was nicht viel klingt, aber für eine URL, einen Hash und andere Klartextdaten ausreicht. Mehrseitige Dokumente oder Frames in einem Video können eindeutige Codes haben, wodurch sich diese Menge vervielfacht. Aber das ist nur meine Spekulation.

Steg.AI hat mir mehrere Bilder mit Wasserzeichen zur Prüfung bereitgestellt, von denen Sie einige hier eingebettet sehen können. Mir wurden auch die passenden Vor-Wasserzeichen-Bilder zur Verfügung gestellt (und ich wurde gebeten, sie nicht weiterzugeben); Bei näherer Betrachtung waren zwar einige Störungen sichtbar, aber wenn ich nicht gewusst hätte, danach zu suchen, hätte ich sie wahrscheinlich übersehen oder sie als gewöhnliche JPEG-Artefakte abgeschrieben.

Ja, dieser ist mit einem Wasserzeichen versehen.

Hier ist ein weiteres, von Hokusais berühmtesten Werken:

Bildnachweis: Hokusai / Das Art Institute of Chicago

Sie können sich vorstellen, wie nützlich eine so subtile Markierung für einen Stock-Fotografie-Anbieter, einen YouTuber, der seine Bilder auf Instagram veröffentlicht, ein Filmstudio, das Vorabkopien eines Spielfilms vertreibt, oder ein Unternehmen, das seine vertraulichen Dokumente kennzeichnen möchte, nützlich sein könnte. Und das sind alles Anwendungsfälle, die Steg.AI untersucht.

Es war von Anfang an kein Homerun. Schon früh, nach Gesprächen mit potenziellen Kunden, „wurde uns klar, dass viele unserer ursprünglichen Produktideen schlecht waren“, erinnert sich Wengrowski. Sie stellten jedoch fest, dass Robustheit, ein wesentliches Unterscheidungsmerkmal ihres Ansatzes, auf jeden Fall wertvoll war, und haben seitdem bei „Unternehmen, bei denen ein starkes Verbraucherinteresse an durchgesickerten Informationen besteht“, wie beispielsweise Marken der Unterhaltungselektronik, Anklang gefunden.

„Wir waren wirklich überrascht vom Atem der Kunden, die einen großen Wert in unseren Produkten sehen“, schrieb er. Ihr Ansatz besteht darin, SaaS-Integrationen auf Unternehmensebene bereitzustellen, beispielsweise mit einer Digital-Asset-Management-Plattform – so muss niemand das Wasserzeichen vor dem Versenden sagen; Alle Medien werden im Rahmen des normalen Handhabungsprozesses markiert und nachverfolgt.

Konzeptdarstellung einer Steg.AI-App, die ein Bild überprüft.

Ein Bild könnte bis zu seiner Quelle zurückverfolgt werden, und möglicherweise könnten auch unterwegs vorgenommene Änderungen erkannt werden. Oder alternativ könnte die App oder API die Gewissheit bieten, dass das Bild nicht manipuliert wurde – etwas, das viele Redaktionsfotografen zu schätzen wissen würden.

So etwas hat das Potenzial, ein Industriestandard zu werden – sowohl weil sie es wollen, als auch weil es in Zukunft möglicherweise erforderlich sein wird. KI-Unternehmen haben erst kürzlich zugestimmt, Forschungen zum Wasserzeichen von KI-Inhalten durchzuführen, und so etwas wäre eine nützliche Notlösung, während über eine tiefergehende Methode zur Erkennung generierter Medien nachgedacht wird.

Steg.AI ist mit NSF-Zuschüssen und Angel-Investitionen in Höhe von insgesamt 1,2 Millionen US-Dollar so weit gekommen, hat aber gerade eine 5-Millionen-Dollar-A-Runde unter der Leitung der Paladin Capital Group mit Beteiligung von Washington Square Angels, dem NYU Innovation Venture Fund und Angel-Investoren Alexander Lavin angekündigt , Eli Adler, Brian Early und Chen-Ping Yu.

source-116

Leave a Reply