Dieser GTA 5-Story-Mod zeigt das enorme Potenzial – und die Probleme – KI-gestützter NPC-Gespräche

Was wäre, wenn Sie in Grand Theft Auto 5 durch die Straßen von Los Santos patrouillieren und frei mit den Bewohnern sprechen könnten? Und was wäre, wenn sie Ihnen tatsächlich mit einem authentischen, individuellen Dialog antworten könnten?

Das ist das Ziel von Sentient Streets, einem neuen, auf Geschichten basierenden GTA 5-Mod des erfahrenen Mod-Entwicklers Bloc, der jetzt erhältlich ist NexusMods.

Darin übernehmen die Spieler die Rolle eines jungen Polizisten, der in Los Santos eine Verschwörung über den Aufstieg der KI untersucht. Zurück im wirklichen Leben ist es inzwischen die KI, die die Gespräche des Mods mit NPCs auf der ganzen Welt antreibt.

Newscast: Unsere am meisten erwarteten Spiele für den Rest des Jahres 2023.Auf YouTube ansehen

„Ich hatte immer die Idee, eine virtuelle Welt wie GTA zu erschaffen, aber eine Version, in der man auch mit NPCs wie echten Menschen interagieren und sprechen kann“, sagte Bloc gegenüber Eurogamer. Er hat zuvor an Mods für Bannerlord und Skyrim gearbeitet, die KI-gestützte Large Language Models (LLMs) nutzten, bevor er Beschwerden über die Zukunft der Technologie sah.

„LLMs in Spielen [have been called] „Ein ‚Gimmick‘, da man nur mit den Charakteren reden konnte, und das war’s“, fuhr Bloc fort. „Ich war mit dieser Idee nicht einverstanden, aber einfach nicht zuzustimmen war nicht genug.“ Also wollte ich es beweisen.

Bloc spielt in der Geschichte der Mod mit der Angst vor KI, während der Spieler es mit einem tödlichen Kult aufnimmt, der eine unsichtbare KI verehrt. Dabei führen sie in Echtzeit offene Gespräche mit rund 30 KI-NPCs.

„Hoffentlich konnte ich mit dieser Mod zeigen, dass der Einsatz von KI in Videospielen nicht unbedingt völlige Zufälligkeit und unvorhersehbares Gameplay bedeutet und Spiele, die eine Geschichte erzählen möchten, auch LLMs nutzen können, um ihr Geschichtenerzählen mit einzigartigen Rollenspielerlebnissen zu bereichern Spieler.“

NPC-Gespräche in Sentient Streets werden von der Character Engine von Inworld unterstützt, wobei Bloc im Early Access mehrere Funktionen nutzen kann. Inworld ist ein Tool, das KI-NPCs antreibt und Charaktere verspricht, die „zu multimodalem menschlichen Ausdruck fähig sind“. laut seiner Website. Im Prinzip erlaubt das Tool Entwicklern, Charaktere durch Ausfüllen von Parametern zu erstellen; Speech funktioniert frei von dort aus und integriert Technologie des Sprachsynthese- und Text-to-Speech-Softwareunternehmens ElevenLabs.

„Wir freuen uns, die Echtzeit-Sprachtechnologie von ElevenLabs zu integrieren, die unser bereits umfassendes Standardsystem für die generative KI-NPC-Erstellung stärkt“, sagte Kylan Gibbs, Chief Product Officer von Inworld, in einer Pressemitteilung für Sentient Streets. „Indem wir auf die Nachfrage der Community nach verbesserten Sprachfunktionen reagieren, kommen wir dem Ziel, Charaktere glaubwürdiger und lebensechter zu machen, einen Schritt näher. Wir statten Entwickler mit den Tools aus, mit denen sie über Dialogbäume und skriptgesteuerte Interaktionen hinausgehen können.“

Mati Staniszewsi, CEO von ElevenLabs, sagte: „Durch die Kombination unserer führenden KI-Sprachsoftware mit der Plattform von Inworld verschieben wir die Grenzen immersiver Spielerlebnisse und fügen den Spielwelten eine zusätzliche Ebene an Möglichkeiten hinzu.“

„Unser Mehrzweck-Tool verleiht KI-Charakteren gesprochenes Audio in höchster Qualität, integriert dabei menschenähnliche Intonation und Tonfall und passt sich gleichzeitig an kontextbezogene Hinweise an. Wir sind von dieser Entwicklung sehr begeistert und können es kaum erwarten, zu sehen, wie sie von der breiten Masse genutzt wird.“ Entwickler-Community.“

Bloc erklärt, dass die Integration mit Inworld „ziemlich einfach“ war, da die Software eine Reihe von Funktionen bietet, die von Spielern erwartet, aber nicht immer in Tools bereitgestellt werden, wie etwa Spracherkennung, Charakterstimmen und Emotionen.

Der Modder hat parallel zur Veröffentlichung des Mods ein Video von Sentient Streets auf YouTube gepostet und die Ergebnisse sind sicherlich verblüffend. Spieler gehen auf bestimmte NPCs zu und halten, nachdem sie ihre Aufmerksamkeit erregt haben, eine Taste gedrückt, um in ein Mikrofon zu sprechen. Die KI antwortet dann frei. Schon früh wählt Bloc einen Partneroffizier aus, indem er sich unterhält und ihn nach seinem Namen und seiner Hintergrundgeschichte fragt. Später spricht er am Tatort mit einem Verdächtigen und kann durch Rollenspiele an Informationen gelangen.

https://www.youtube.com/watch?v=cu4g743ONoo
Bloc’s AI Powered GTA 5: Story-Modus mit KI-NPCs-Mod

Es ist natürlich nicht perfekt. Die KI braucht einige Zeit, um Gespräche zu verarbeiten, macht gelegentlich Fehler und wiederholt sich manchmal. Aber mit der Verfeinerung wird das Potenzial dieser Art von Werkzeug augenöffnend.

Der Mod von Bloc startete mit über 3000 Downloads in einer Woche. Hat die KI beim Einsatz in großem Maßstab einige seltsame oder lustige Reaktionen hervorgerufen?

„Selbst während ich den Mod testete, hat mich die KI oft mit ihren ‚listigen‘ Antworten oder unerwarteten Reaktionen zum Lachen gebracht“, sagte Bloc. „Ich habe ein paar Streams von YouTubern gesehen, die den Mod spielten. In einem lustigen Gespräch gab ein YouTuber seinem Partner die Schuld für ein Verbrechen, das er begangen hatte, aber der KI-Kapitän erkannte die Lüge und beschuldigte ihn, ein Lügner zu sein. In einem anderen Gespräch machte a Der YouTuber unterhielt sich mit einem verrückten Sektenmitglied und machte ihn wahnsinnig, indem er völlig unzusammenhängende Fragen stellte, um ihm unter die Haut zu gehen.

„Manchmal finde ich es wirklich überraschend, dass die KI sehr kluge Antworten auf meine offensichtlichen Fragen gibt, und es macht immer Spaß zu sehen, wie sie den Spieß umdreht.“

Natürlich bleibt der Einsatz von KI ein heikles Thema. Ubisoft stellte Anfang des Jahres ein KI-Tool zur Unterstützung des Drehbuchschreibens vor, das speziell für die Verwendung mit Hintergrund-NPCs gedacht ist, was Befürchtungen hervorrief, dass es den Nachwuchsautoren Arbeit wegnehmen würde. Viele Akteure stehen der KI mittlerweile skeptisch gegenüber – insbesondere dem Aufkommen von Deepfake-KI-gesteuerten Mods, bei denen Stimmen ohne Erlaubnis verwendet werden.

Inworld nutzt eine Sprachbibliothek von ElevenLabs und stellt selbst keine Synchronsprecher ein. Aber ElevenLabs ist ein KI-Klon-Tool, das bereits von besorgten Akteuren gefordert wurde. Es ist Nutzungsbedingungen legt fest, dass Benutzer entweder der Ersteller und Eigentümer von Dateien sind, die zur Generierung von KI-Sprache verwendet werden, oder dass sie über die schriftliche Zustimmung jeder identifizierbaren Einzelperson in den Dateien verfügen. Es ist jedoch immer noch schwierig zu wissen, woher die Sprachdaten von ElevenLabs stammen.

„Standardmäßig auf der Plattform verfügbare Stimmen werden entweder durch KI-Algorithmen generiert, die Stimmmerkmale nach dem Zufallsprinzip abtasten (d. h. sie imitieren oder reproduzieren nicht die Stimme einer bestimmten Person) oder werden durch gesetzlich vereinbarte, zeitlich begrenzte Partnerschaften mit Synchronsprechern entwickelt. mit neuen benutzerdefinierten KI-Stimmen, die dadurch erstellt wurden“, sagte ein ElevenLabs-Sprecher in einer Erklärung gegenüber Eurogamer. „ElevenLabs bietet auf der Plattform keine KI-Stimmen an, die auf der Stimme einer realen Person basieren, ohne die ausdrückliche Genehmigung dieser Person.

„ElevenLabs ermöglicht es Benutzern außerdem, neue, zufällig generierte KI-Stimmen zu erstellen und diese als Teil der von der Community geführten Stimmenbibliothek zu teilen. Darüber hinaus haben Benutzer die Möglichkeit, geklonte Stimmen für ihre eigene Arbeit zu erstellen, wenn sie über die entsprechenden Rechte und Berechtigungen verfügen.“ Diese Stimmen. Diese Stimmen können nicht in der Stimmenbibliothek geteilt werden. Benutzer, die gegen die Nutzungsbedingungen verstoßen, werden von der Plattform ausgeschlossen – jeder wird aufgefordert, Inhalte zu melden, die seiner Meinung nach gegen diese Nutzungsbedingungen verstoßen.“

Bloc sagte, er habe zuvor gegenüber Inworld bestätigt, dass es Stimmen für sein Tool aus der ElevenLabs-Sprachbibliothek ausgewählt habe.




Chatten in einem Polizeiauto in Blocs AI GTA 5-Mod

Bildnachweis: Block

Dennoch bestehen weiterhin allgemeine Bedenken hinsichtlich des Einsatzes von KI in der Videospielentwicklung. Studios sollten „auf jeden Fall vorsichtig sein, wie sie KI nutzen“, so Bloc weiter – insbesondere bei der Nutzung von Sicherheitsfunktionen und bei Datenschutzbedenken.

„Inworld hat die Sicherheitsfunktionen der Sprachmodelle gelockert, weil es für ein bewaffnetes Sektenmitglied keinen Sinn machen würde, super nett und hilfsbereit zu sein, während es mit Ihnen spricht“, erklärte Bloc. „Man würde von dieser Person erwarten, dass sie aggressiv ist, einen beschimpft und einen Charakter hat, bei dem man Schwierigkeiten hat, eine gemeinsame Basis zu finden. Aber diese Entspannung.“ [of the rules] Es kann nicht immer gut laufen.“

Entwickler müssen sicherstellen, dass sie ein Gleichgewicht zwischen authentischer Charakterisierung und der Bereitstellung einer KI-Stimme für Toxizität finden, fährt er fort.

„Ein superstriktes LLM zu haben macht keinen Spaß, aber ein schrecklich giftiges LLM in einem Videospiel macht auch keinen Spaß und ist auch nicht sicher“, sagte Bloc. „Diese Balance muss sorgfältig an die Bedürfnisse dieses Spiels angepasst werden.“

Was Datenschutzfragen angeht, sagte Bloc, er habe gesehen, wie Menschen LLMs aufgrund ihrer menschenähnlichen Gesprächsfunktionen vermenschlichten. „Dies kann zu einigen Datenschutzbedenken führen, da Menschen ihre persönlichen Daten und Informationen mit Chat-KIs teilen können“, sagte er. „Einige dieser persönlichen Daten können für Menschen in bestimmten Ländern sehr problematisch sein. Ich denke, Maßnahmen zur Vermeidung von Datenschutzverletzungen sollten eine der höchsten Prioritäten von Entwicklern sein, die mit Sprachmodellen arbeiten.“

Was Sentient Streets angeht, hat Bloc bisher eine Welle positiver Rückmeldungen erhalten – und sagt, dass Spieler in diese Art von KI investieren, weil sie ihre Freude am Spiel steigert. Er glaubt, dass diese Art von Inhalten in Zukunft einen Platz in der Spielebranche finden wird, aber nicht unbedingt bei Rockstar.

„Die Marke Grand Theft Auto mag derzeit die größte Marke in der Spielebranche sein, aber es ist unwahrscheinlich, dass Rockstar versuchen wird, etwas so Neues in seinem nächsten Titel zu übernehmen“, sagte Bloc. „Allerdings werden wir in Zukunft wahrscheinlich viele GTA-ähnliche Spiele mit dieser Technologie sehen, oder vielleicht auch große Mods für GTA 6.“

Da GTA 6 voraussichtlich im nächsten Jahr erscheint, wird es nicht lange dauern, bis wir es herausfinden.


source site-58

Leave a Reply