Die KI verbringt 7.000 Stunden damit, das erste Fitnessstudio von Pokémon Red zu besiegen, kann das zweite aber nach 50.000 Stunden immer noch nicht finden


Ein Programmierer hat einem KI-Modell 50.000 Stunden lang darin trainiert, wie man Pokemon Red spielt. Daraus ist ein Algorithmus entstanden, der das Spiel erkunden und ein Team zusammenstellen kann, um den ersten Arenaleiter zu besiegen – aber keinen, der seinen Weg durch Mt. findet . Moon oder weiß es besser, als weiterhin Magikarp zu kaufen. Vor allem ist diese Übung eine faszinierende Möglichkeit, einen Eindruck davon zu bekommen, wie maschinelles Lernen tatsächlich funktioniert.

Wie in einem ausführlichen Video von Peter Whidden dargelegt, kann die KI über die üblichen Steuereingaben eines Emulators mit dem Spiel interagieren. Es drückt einen Knopf und schaut auf den Bildschirm, um zu sehen, was passiert ist, genau wie ein menschlicher Spieler. Whidden legte für die Lernsitzungen eine Spielzeit von jeweils zwei Stunden fest, doch mit einer beschleunigten Emulation konnten diese Sitzungen in etwa sechs Minuten in Echtzeit abgeschlossen werden – und der Prozess wurde durch die gleichzeitige Ausführung von 40 Testsitzungen noch weiter beschleunigt.



Source link-47