DeepMinds neue KI nutzt Spieltheorie, um Menschen in „Stratego“ zu verprügeln


Bild für Artikel mit dem Titel „DeepMinds neue KI nutzt Spieltheorie, um Menschen in „Stratego“ zu verprügeln“

Bildschirmfoto: DeepMind

Den Menschen gehen schnell die Brettspiele aus, die wir noch spielen können, ohne von KI völlig überfordert zu sein. In der Vergangenheit, Forscher demonstrierten die Fähigkeit der KI, Menschen zu besiegen Schach, gehenund vor kurzem Diplomatie. Jetzt können Sie das Strategiespiel Stratego jetzt zu diesem Evergreen hinzufügen.wachsende Liste.

Forscher von Alphabet-DeepMind im Besitz von DeepMind sagen laut neuen, mit Gizmodo geteilten Forschungsergebnissen, dass sie einen neuen KI-Agenten entwickelt haben, der in der Lage ist, Stratego auf einem „menschlichen Expertenniveau“ zu spielen. Die KI namens DeepNash gewann fast alle Spiele, die sie gegen andere KIs spielte, und hatte einen 84 % Gesamtgewinnrate im Wettbewerb gegen menschliche Spieler in Online-Spielen. DeepNash, das lernte, das Spiel zu meistern, indem es gegen sich selbst spielte, war in der Lage, komplexe Entscheidungen zu treffen und Kompromisse auf „außergewöhnliche“ Weise in Betracht zu ziehen, wie es frühere KI-Systeme nicht konnten.

Während Stratego zunächst nicht wie das offensichtlichste Beispiel für das Training einer KI erscheint, sagen die Forscher, dass die Kombination des Spiels aus längererDie langfristige Entscheidungsfindung und der unvollkommene Zufluss unvollkommener Informationen machen es zu einem einzigartigen Prüfstand. Das Spiel wird normalerweise von zwei Spielern gespielt und beinhaltet sowohl Strategie als auch Täuschung. Die Spieler haben jeweils ihre eigenen „Armeen“, die aus Teilen mit jeweils eigenen Werten bestehen. Die Spieler gewinnen, indem sie entweder die Flagge eines Gegners erobern oder alle ihre beweglichen Teile erobern.

All diese Figuren mit ihren unterschiedlichen Werten führen zu einer extrem großen Menge an möglichen Zügen und Ergebnissen. Die Forscher sagten, Stratego habe viel mehr „mögliche Zustände“ als Texas Hold’em Poker und sogar mehr als Go, das oft für seine immense Vielfalt an möglichen Entscheidungen angekündigt wird.

Um zu gewinnen, mischte DeepNash sowohl langfristige Strategien als auch kurzfristige Entscheidungen wie Bluffen und das Eingehen von Risiken. Es ist selten, dass zwei dieser Dinge gleichzeitig so gut von einem KI-Agenten erledigt werden können. Strategos Kombination aus langem, strategischem Denken und darauf basierenden Entscheidungen unvollständige oder begrenzte Informationen haben frühere KI-Modelle größtenteils vereitelt.

„DeepNash war in der Lage, nicht triviale Kompromisse zwischen Informationen und Material einzugehen, Bluffs auszuführen und bei Bedarf zu riskieren“, so der Forschern schreiben.

DeepNash scheint von amerikanischen Mathematikern beeinflusst zu werden John Nash der unter anderem The Nash Equilibrium geprägt hat. Kurz gesagt bezeichnet dieses Gleichgewicht eine spieltheoretische Lösung, bei der beide Kontrahenten, die gegeneinander antreten, keinen Anreiz mehr haben, von ihrer ursprünglichen Strategie abzuweichen. Von den vielen möglichen Szenarien wird das Nash-Gleichgewicht in der Spieltheorie oft als das „optimale“ Ergebnis angesehen.

DeepNash versucht im Kern, das Nash-Gleichgewicht in Stratego-Spielen mithilfe von zu lokalisierenNeue Kombination aus Selbstspiel und Modell-kostenloses Lernen von Verstärkungsalgorithmen namens „R-NaD“. Durch die Verwendung sowohl dieses Algorithmus als auch der tiefen neuronalen Netzwerkarchitektur konnten die Forscher selbst in äußerst komplexen Situationen einen überzeugenden Bot erstellen. Obwohl DeepNash darauf trainiert wurde, in Stratego anzutreten, scheint DeepMind ein Spieltheorie-Genie geschaffen zu haben.

Forscher testeten DeepNash, indem sie es gegen andere Bots und gegen „menschliche Spitzenspieler“ auf der Online-Gaming-Plattform Gravon antraten. DeepNash erreichte gegen die Bots eine Mindestgewinnrate von 97 %. Seine Leistung gegen Menschen war mit einer Gesamtgewinnrate von 84 % nur geringfügig schlechter. Die KI gehörte seit Jahresbeginn zu den drei besten Spielern und alle Zeiten Bestenliste.

„Nach unserem besten Wissen ist dies das erste Mal, dass ein KI-Algorithmus lernen konnte, Stratego auf menschlicher Expertenebene zu spielen“, sagten die Forscher.

source-113

Leave a Reply