Fragen und Antworten zu NPCx – Diese KI-basierte Technologie kann NPCs kostengünstig animieren und sogar Drivatar-ähnliche Spielerklone erstellen


KI-Startup mit Sitz in Florida NPCx machte kürzlich Schlagzeilen, nachdem es den Hauptinvestor für seine 3-Millionen-Dollar-Investition in der Startkapitalrunde gewonnen hatte. Der Investor ist kein geringerer als Kakao Investment, eine Niederlassung von Kakao Games, die Gamern als alter westlicher Herausgeber von Black Desert Online und neuer Herausgeber von XLGames‘ ArcheAge bekannt ist, einschließlich der mit Spannung erwarteten MMO-Fortsetzung.

NPCx besteht aus Computeringenieuren, Datenwissenschaftlern, Künstlern und Animatoren. Das Startup verfügt über eine Reihe von Produkten, die sich der kostengünstigen Animation von Nicht-Spieler-Charakteren (NPCs) widmen. Ihr Schlüsselprodukt BehaviorX geht jedoch noch einen Schritt weiter und ermöglicht es ihnen, Drivatar-ähnliche Spielerklone für verschiedene Zwecke zu erstellen.

Um NPCx und seine KI-basierten Produkte zu besprechen, hatte ich ein nettes, langes Gespräch mit Mitbegründer und CEO Cameron Madani. Das vollständige Gespräch (aus Gründen der Übersichtlichkeit bearbeitet) finden Sie unten.

Cameron, können Sie über sich und das Unternehmen sprechen?

Sicher. Lassen Sie mich Ihnen einen ganz kurzen Hintergrund geben. Es gibt drei Gründer: ich, Michael Puscar und Alberto Menache.

Ich bin seit 2000 in der Videospielentwicklung tätig und habe an einer Reihe von Titeln in den Bereichen Unternehmensentwicklung und Geschäftsentwicklung gearbeitet. Im Jahr 2011 startete ich meinen ersten eigenen Versuch, ein Spielestudio zu gründen.

Wir haben für Microsoft an einem Titel namens Torchlight für die Xbox gearbeitet. Es lief nicht sehr gut, also beschloss ich, mich mehr auf die Serviceseite des Geschäfts zu konzentrieren.

Im Jahr 2014 gründete ich ein Motion-Capture- und Animationsstudio namens Motion Burner. Dann wurde mir klar, dass es viele sich wiederholende Prozesse gibt, die sehr, sehr zeit- und kostenintensiv sind. Einiges davon ist auch sehr manuell, daher macht es weder viel Spaß noch ist es kreativ, besonders wenn es um Motion Capture geht.

Ich habe Michael durch einen Freund kennengelernt. Michael ist ein Serienunternehmer. Er ist Computeringenieur, wurde aber Datenwissenschaftler. Ich fragte ihn, ob es irgendetwas im Bereich maschinelles Lernen oder künstliche Intelligenz gäbe, das diesen sehr kostspieligen Prozess der Erstellung von Animationen mit Motion Capture unterstützen könnte.

Wir entwickelten eine Hypothese, testeten sie und gründeten das Unternehmen im Jahr 2020, kurz vor der Pandemie, im Februar 2020. Wir entwickelten eine Produkt-Roadmap und dann kam jemand zu uns und bat darum, einen Prototyp eines Motion-Matching zu bauen Produkt. Ubisoft ist einer der Pioniere auf diesem Gebiet. Tatsächlich verfügen viele Spielefirmen über ihre eigene Technologie; sie teilen es nicht. Sie wollen es für ihre eigenen Zwecke nutzen. Also haben wir als MVP mehr oder weniger ein ähnliches System wie Ubisoft geschaffen, das uns dabei geholfen hat, tatsächlich Startkapital bereitzustellen. Dann haben wir eine Spendenaktion gestartet auf Republic.com, was großartig war. Wir haben eine halbe Million Dollar gesammelt und konnten mit der Entwicklung der Produkt-Roadmap beginnen.

Der Grund, warum wir diesen ersten Kunden ausgewählt haben, war die Bereitstellung des Anfangskapitals, aber das war nicht Teil unserer Roadmap, bei der es um die Entwicklung von Tools zur Automatisierung der Animationspipeline für die Spieleindustrie, die Filmindustrie, XR und Metaverse geht.

Was den Namen angeht, sind NPCs einer der wichtigsten Bestandteile eines Spiels. Wir wollten uns in erster Linie darauf konzentrieren, Nicht-Spieler-Charaktere realistisch zu gestalten, nicht nur in der Art und Weise, wie sie sich bewegen, sondern auch in der Art und Weise, wie sie handeln.

Würden Sie die NPCx-Technologie der Kategorie der generativen KI zuordnen?

Das ist eine gute Frage. Der grundlegenden generativen KI, der Fähigkeit, diese Sprachmodelle zu erstellen, und generativen Animationssystemen wird große Aufmerksamkeit geschenkt. Es gibt eine Firma namens Inworld AI. Ich finde sie sehr, sehr interessant und fesselnd, aber im Grunde erschaffen sie generative KI mit einer Animation. Meiner Meinung nach ist es etwas trivial. Unser System nutzt einzigartige neuronale Netze. Wir konzentrieren uns mehr auf die Physik und den Körper.

Zwei unserer Entwickler sind Biomechanik-Ingenieure mit Erfahrung in der Robotik. Alle unsere Datenwissenschaftler sind Physiker. Einige NPCx-Technologien verwenden generative KI-Techniken, andere jedoch nicht. einige sind biomechanische Modelle. Der generative Aspekt ist nicht so allgemein wie ein LLM.

Aber es basiert immer noch auf einem neuronalen Netzwerkmodell, oder?

Ja. Wir haben tatsächlich mehrere Arten von neuronalen Netzen.

Okay. Es gibt vier Zweige im NPCx-Tech-Stack. Warum gehst du sie nicht durch?

Sicher. AimX ist eigentlich das MVP, das wir ursprünglich für einen anderen Kunden erstellt haben. Es ist das Motion-Matching-System. Das behalten wir bei, da dieser Stack für BehaviorX verwendet wird.

Aber der Grund, warum Michael und ich ursprünglich mit dem Einkaufen angefangen haben, war TrackerX. Damit speichern wir Motion Capture direkt von der Bühne. Die besten Systeme der Welt können etwa 90 % der Probleme beseitigen. Normalerweise werden die Markierungen blockiert. Wenn zwei Personen zusammenstehen, können die Brustmarkierungen verschwinden, die Fußmarkierungen können verschwinden, wenn sie auf einer Matte springen usw. Für einen durchschnittlichen Triple-A-Titel ist ein Team aus 20 oder 30 Personen erforderlich, um die Bewegungserfassung zu bereinigen.

Was wir gesagt haben, ist, dass wir neuronale Netze trainieren können, um zu sehen, wie es auf der Bühne aussieht, und dann zeigen wir ihm, was ein Mensch danach getan hat, nämlich die Reinigung. Unsere Hypothese war, dass wir neuronalen Netzen beibringen könnten, die Daten mit der physikbasierten Engine zu bereinigen. Es dauerte ungefähr zwei Jahre und 750.000 Kapital, um das endlich zu schaffen.

Wir haben den ersten Teil davon im März gestartet, aber es gibt definitiv Widerstand in der Branche, und das haben wir nicht vorhergesehen. Wenn wir an die Spitze der Bewegungserfassung gehen, werden sie sagen: Ich müsste damit drei Viertel meines Teams entlassen. Die Kosten sind so wettbewerbsfähig, dass wir über diesen Entscheidungsträger hinaus auf die Führungsebene springen müssen.

Es ist sicherlich ein interessantes Rätsel. Der Hauptvorteil dieser NPCx-Technologie wäre, dass sie viel günstigere Motion-Capture-Animationen ermöglicht, oder?

Sie können mit dem gleichen Budget mehr Animationen erstellen oder die gleiche Menge an Animationen wie zuvor erstellen und dabei die Kosten erheblich senken.

Können Sie etwas über die Umsetzung sagen? Haben Sie ein Plugin für Unreal Engine oder Unity? Wie einfach ist es für Entwickler, die NPCx-Technologie zu implementieren?

Grundsätzlich stellen sie uns die Dateien in ihrem Format zur Verfügung. Wir nehmen jedes Format, das sie uns geben, wir konvertieren es in unseres, wir verarbeiten es und geben es dann in das gleiche Format zurück, das sie wollten.

Das, was mich am meisten interessiert, ist definitiv BehaviorX. Wie funktioniert es?

Nun, BehaviorX erfordert eine gewisse Integration in ein Spiel. Im einfachsten Kern geht es darum, Verhaltensklone von Spielern in Spielen zu beobachten und zu erstellen. Da wir die Animationssysteme übernehmen müssen, müsste es eine API-Anbindung geben.

Es gibt auch eine Opt-in-Option auf Spielerebene, da wir Spieler beobachten. Wir wollen nicht einfach hineingehen und Spieler ohne ihr Wissen beobachten. Da sind der Vertrauensfaktor und alle rechtlichen Konsequenzen, die das Klonen von Spielern usw. mit sich bringt.

Aber die Funktionsweise besteht einfach darin, dass wir zunächst das gesamte verfügbare Universum an Optionen auf einer Ebene verstehen. Ich verwende immer das Zelda-Beispiel. Nehmen wir an, Sie befinden sich in einem Zelda-Dungeon, oder?

Es gibt eine bestimmte Anzahl an Umgebungsplättchen, eine bestimmte Menge an Platz innerhalb der Umgebung, es gibt bestimmte Ziele, Feinde, Türen und Fallen. Wir wollen alles verstehen, was in diesem Level passiert, und dann beobachten wir, wie ein Spieler spielt.

Nehmen wir an, Sie sind ein Spieler der Stufe 1. Du hast eine bestimmte Waffe, Rüstung, Tränke, Magie oder was auch immer. Du hast deine Gesundheit. Wie viel hast du in deinem Rucksack? Was haben Sie erreicht?

Basierend auf dem, was Sie tun, was Sie haben und wie Ihr Zustand ist, können wir dies in Form eines Klons nachbilden. Nehmen wir an, es gibt einen Boss auf einer Ebene und Sie sind eindeutig untermächtig. Deine Waffe ist nicht sehr stark und du bist in einem schlechten Gesundheitszustand und du greifst diesen Boss an. Wir können feststellen, dass Sie risikofreudig sind.

Wenn Sie über starke Waffen und Rüstungen sowie volle Gesundheit verfügen und auf einen mittleren oder niedrigen Boss stoßen und sich dafür entscheiden, diese zu meiden und sich stattdessen auf die Erkundung zu konzentrieren, können wir feststellen, dass dies Ihr Spielstil ist. Damit können wir Ihren Verhaltensklon erstellen und nachahmen, was Sie auf einer anderen Ebene tun würden. Nun, die Auswirkungen dort sind ziemlich groß.

Ja. Es müsste eine Opt-in-Option sein, da ich sicher bin, dass einige Spieler nicht gerne geklont werden würden.

Absolut. Ein Teil unserer Marke besteht darin, offen und ethisch zu sein, denn die möglichen Auswirkungen sind ziemlich unheimlich. Viele Menschen werden bei ihren Aktivitäten im Internet, in den sozialen Medien und dergleichen beobachtet und ausgenutzt. Wir tun dies, weil wir der Meinung sind, dass es richtig ist, ein Opt-in-System zu haben. Wir tun dies aber auch unter dem Gesichtspunkt des Risikomanagements, um künftige Klagen zu vermeiden.

Hier ist etwas Interessantes, das uns passiert ist. Auf der Game Developers Conference im vergangenen März kamen Gerüchte auf, dass wir die Motion-Capture-Daten unserer Kunden zur Erstellung unserer Modelle verwenden würden. Die Leute versuchen uns zu sabotieren, weil sie Angst vor uns haben. Wir teilen jedem Kunden im Rahmen unseres Vertrags ausdrücklich mit, dass wir Ihre Daten nicht zum Trainieren unserer verallgemeinerten Modelle für die Verwendung für andere Kunden verwenden, wenn Sie uns Bewegungserfassungsdaten für TrackerX zur Verfügung stellen, damit wir diese zur Bereinigung Ihrer Daten verwenden können.

Speziell in Bezug auf BehaviorX glaube ich, dass Sie sagten, Sie hätten bei Microsoft gearbeitet. Wie Sie vielleicht bereits wissen, verwenden sie Drivatars schon seit langem in Forza Motorsport-Spielen (obwohl das im letzten Monat veröffentlichte neue Spiel das Konzept aufgegeben hat). Ich habe mich gefragt, wie ähnlich das der Technologie ist, die Sie bei NPCx entwickelt haben.

Es ist ein ähnlicher Ansatz. Aber das ist die Sache: Es gibt viele interessante Dinge in der Branche. Die großen Unternehmen bauen etwas und sie halten es. Den kleinen Unternehmen fehlt das Budget, um so etwas zu bauen. Wir passen irgendwie in dieses Loch.

Unsere Technologie kann sicherlich mit anderen AAA-Studios als Microsoft zusammenarbeiten, die an ihrer Arbeit interessiert sind, sodass sie kein Team einstellen müssen. Und dann gibt es noch die kleinen Unternehmen, die sicherlich nicht über das Budget oder die Ressourcen verfügen, um dies zu schaffen. Wir sind also in der einzigartigen Position, Technologien zu entwickeln, die denen der größten Unternehmen ähneln.

Du könntest da draußen einen Klon von dir haben. Irgendwann würde es immer besser werden, weil wir einen Basisklon und dann noch mehr Daten bekamen, diese bereinigten und beobachteten. Eine Anwendung ist Koop. Wenn Sie es gewohnt sind, mit drei Ihrer Freunde im Vier-Personen-Format zu spielen, aber nur zwei verfügbar sind, können Sie sich den Klon des anderen Freundes schnappen, um mit Ihnen zu spielen.

Sie könnten auch dafür bezahlen, den Klon eines hochrangigen eSport-Spielers zu erhalten, der mit Ihnen spielt. Wir könnten sogar eine Kombination aus Klonen erstellen. Wir könnten ein wenig vom Klon dieser Person und vom Klon dieser Person nehmen, um einen Archetyp zu erschaffen, wie einen Scharfschützen oder einen Dieb.

Unsere Technologie kann auch weit über Videospiele hinausgehen. Wir können Sensoren an Menschen anbringen und sehen, was sie in menschlichen Situationen tun. Es könnte auf Arbeiter, Militär, Bildung usw. angewendet werden.

BehaviorX befindet sich noch in der Entwicklung, richtig?

Ja. Wir beginnen mit 2D-Spielen, etwa Puzzlespielen, und dann beginnen wir zu lernen und sehen, ob wir das Modell erstellen können.

Gibt es bei NPCx eine interne Schätzung, wann diese Technologie bereit sein wird?

Wir streben Anfang 2025 an. Dann planen wir, eine frühe Version von BehaviorX in einem der von unseren Investoren entwickelten Titel zu haben. Von dort aus gehen wir weiter zu 3D.

Vielen Dank für Ihre Zeit.

Teilen Sie diese Geschichte

Facebook

Twitter

source-99

Leave a Reply