Synthetaic behauptet, dass synthetische Daten in Bezug auf KI genauso gut sind wie echte Daten


Erinnern Sie sich an den chinesischen „Spionageballon“ aus dem Jahr 2023? Falls nicht, hier eine Erinnerung: Vor etwa einem Jahr flog ein aus China stammender Höhenballon weitgehend unentdeckt durch den amerikanischen Luftraum. Später wurde der Ballon von der US-Luftwaffe entdeckt und abgeschossen. Für neugierige zivile Beobachter war es jedoch schwierig, seinen Ursprung zurückzuverfolgen – bis KI-Firmen wie Synthetaic hinzukamen zeigte Dies könnte mit Satellitenbildern geschehen.

Die Ballon-Saga erwies sich, wie es der Zufall so wollte, für Synthetaic als eine großartige Gelegenheit zur Produktdemonstration und erregte die Aufmerksamkeit von Investoren, darunter dem Verteidigungsunternehmen Booz Allen Hamilton.

Diese Woche sammelte Synthetaic 15 Millionen US-Dollar in einer Serie-B-Runde unter der gemeinsamen Leitung von Lupa Systems und TitletownTech, einem VC-Unternehmen, das eine Partnerschaft zwischen den Green Bay Packers und Microsoft unter Beteiligung von IBM Ventures und dem bereits erwähnten Booz Allen Hamilton gründete. Laut CEO Corey Jaskolski beläuft sich die Gesamteinnahme von Synthetaic auf 32,5 Millionen US-Dollar. Das neue Geld wird in die Beschleunigung der Kommerzialisierung der Computer-Vision-Technologie des Unternehmens und in die nahezu Verdoppelung der Mitarbeiterzahl von Synthetaic auf 80 Mitarbeiter bis zum Jahresende fließen, so CEO Corey Jaskolski.

Die Menge der erzeugten Bilddaten wächst exponentiell, was die steigende Nachfrage nach fortschrittlichen KI-Lösungen zur Verwaltung und Analyse dieses riesigen Informationsschatzes unterstreicht“, sagte Jaskolski in einem E-Mail-Interview mit TechCrunch. „Wir haben gesehen, dass die Gewinnung von Erkenntnissen aus diesen riesigen Datenmengen für viele Branchen wie Verteidigung, Geoinformatik, Videosicherheit oder drohnenbasierte Überwachung nach wie vor ein erhebliches Problem und eine Priorität darstellt. Die KI-Lösungen von Synthetaic für unüberwachtes Lernen und Datenanalyse versetzen uns strategisch in die Lage, uns in dieser sich entwickelnden Technologielandschaft zurechtzufinden.“

Jaskolski, ein MIT-Absolvent und ehemaliger Technologiedirektor bei National Geographic, ist der abenteuerlustige Typ. Er ist Er tauchte zwischen Eisbergen in der Antarktis, tauchte 12.500 Fuß unter die Meeresoberfläche, um das Wrack der Titanic zu erkunden, leitete einen Hubschraubereinsatz zur Erstellung einer Karte der napoleonischen Seite des Everest und wagte sich tief in überflutete Höhlen, während er die Opfer von Maya-Menschenopfern und die Eiszeit katalogisierte Bärenskelette.

Synthetisch

Bildnachweis: Synthetisch

Was also veranlasste einen todesmutigen Weltenbummler wie Jaskolski, Synthetaic zu gründen? Es sei ganz einfach, sagt er: Die Erkenntnis, dass KI, die er beobachtet hatte, das Potenzial hatte, bei der Klassifizierung der Informationen der Welt zu helfen, wurde durch die Notwendigkeit gebremst, Daten von Hand zu kommentieren.

„Die menschliche Kennzeichnung ist die Norm für das KI-Training“, sagte Jaskolski. „Je größer KI-Modelle werden, desto leistungsfähiger sind sie, sie benötigen jedoch mehr Daten zum Trainieren, da sie über immer mehr interne einstellbare Parameter verfügen. Lange Zeit bestand die Branchenlösung für dieses Problem darin, Millionen von Menschen buchstäblich Kästchen auf Dinge zeichnen zu lassen und KI zu trainieren. Aber was wäre, wenn wir keine von Menschen beschrifteten Daten benötigen würden?“

Synthetaic wurde 2019 eingeführt und bietet ein Tool: Rapid Automatic Image Categorization, kurz RAIC – wurde entwickelt, um die Analyse großer Datensätze, insbesondere Satellitenbilder und -videos, ohne Beschriftungen zu automatisieren.

Viele KI-Modelle werden trainiert, indem Gruppen von Personen – Annotatoren – Daten kennzeichnen, damit ein Modell lernen kann, bestimmte Anmerkungen (d. h. Beschriftungen) mit Merkmalen der Daten zu verknüpfen. Beispielsweise „lernt“ ein Modell, das mit vielen Katzenbildern mit Anmerkungen zu jeder Rasse gefüttert wird, irgendwann, zwischen Bobtails und Kurzhaarkatzen zu unterscheiden.

Im Gegensatz dazu füttern Benutzer RAIC mit einem einzelnen Bild und RAIC ermittelt, wo sich dieses Bild sonst noch in einem Datensatz befindet.

Im Fall des chinesischen Ballons ermöglichte dies der Plattform von Synthetaic, den Ballon anhand einer Skizze, wie der Ballon aus dem Weltraum aussehen könnte, und aktuellen Satellitenbildern aus dem Gebiet, in dem der Ballon abgeschossen wurde, zu erkennen.

„RAIC bedeutet, in der Lage zu sein, mit knappen oder komplexen Datensätzen umzugehen, die KI-Entwicklung zu beschleunigen und die Vorhersagemodellierung zu verbessern, ohne Einschränkungen durch Datenmenge oder -qualität.“ sagte Jaskolski. „Dies positioniert RAIC als strategischen Aktivposten zur Förderung von Innovation, betrieblicher Effizienz und Wettbewerbsvorteilen, insbesondere in Anwendungsfällen, in denen Daten einen Engpass für die Einführung und Implementierung von KI darstellen.“

Synthetaic ist nicht das einzige Unternehmen, das die Verwendung synthetischer Daten im Modelltraining erforscht.

Synthesis AI, das im April 2022 in einer Venture-Runde 17 Millionen US-Dollar eingesammelt hat, entwickelt eine Plattform, die synthetische Daten generiert, um KI-Systeme verschiedener Art zu trainieren. Scale AI hat vor zwei Jahren ein Programm gestartet, mit dem Ingenieure für maschinelles Lernen vorhandene reale Datensätze mit synthetischen Proben verbessern können. Andernorts gibt es Firmen wie Parallel Domain, die synthetische Daten für bestimmte Anwendungsfälle wie autonomes Fahren erstellen.

Gärtner prognostiziert dass bis 2024 60 % der für die Entwicklung von KI- und Analyseprojekten verwendeten Daten synthetisch generiert werden. Doch während die Branche voranschreitet, befürchten einige Experten, dass die Nachteile synthetischer Daten – und potenzielle Gefahren – ignoriert werden.

Synthetisch

Bildnachweis: Synthetisch

Im Januar 2020 StudieForscher der Arizona State University zeigten, dass ein KI-System, das auf einem Datensatz mit Bildern von Professoren trainiert wurde, äußerst realistische Gesichter erzeugen konnte – allerdings meist weiße und männliche Gesichter. Das System verstärkte die Verzerrungen im ursprünglichen Datensatz, der – wenig überraschend – hauptsächlich männliche und weiße Professoren erfasste.

Die Kunden von Synthetaic haben sich von den Risiken nicht abschrecken lassen, was auch immer es wert ist.

Das Startup behauptet, mit der US-Luftwaffe zusammengearbeitet zu haben, um die KI-gestützte Objekterkennung in Geodaten zu testen, und mit The Nature Conservancy, der gemeinnützigen Umweltorganisation, um Vogelarten zu identifizieren, die früher als ausgestorben galten. Synthetaic hat außerdem einen Vertrag mit AFWERX, dem Forschungslabor der Luftwaffe, über die Entwicklung von Technologien zur Objektkennzeichnung, KI-Modellierung und Objekterkennung in Satellitenbildern.

Jaskolski glaubt das RAIC hat Anwendungen in unzähligen anderen Bereichen, vom KI-Prototyping bis zur drohnenbasierten Überwachung und Inhaltsmoderation. Verweist auf Synthetaic arbeiten Mit CNN zur Analyse von Kriegsbildern aus Gaza und einer Partnerschaft mit Planet Labs zum Verkauf von Analysedaten zusätzlich zu Erdbilddaten behauptet er, dass das Geschäft von Synthetaic dem Abschwung der Technologiebranche – und allgemeineren makroökonomischen Gegenwinden – standhält.

„Die Technologie von Synthetaic bietet einen transformativen Ansatz für das Training und die Erstellung von KI-Modellen und geht auf die kritischen Bedürfnisse technischer Entscheidungsträger ein.“ sagte Jaskolski. „Für C-Level-Manager bedeutet der RAIC von Synthetaic, dass sie in der Lage sind, mit knappen oder komplexen Datensätzen umzugehen, die KI-Entwicklung zu beschleunigen und die prädiktive Modellierung ohne Einschränkungen durch Datenmenge oder -qualität zu verbessern. Dies positioniert RAIC als strategischen Aktivposten zur Förderung von Innovation, betrieblicher Effizienz und Wettbewerbsvorteilen, insbesondere in Anwendungsfällen, in denen Daten einen Engpass für die Einführung und Implementierung von KI darstellen.“

source-116

Leave a Reply