Wenn Sie das ständige Gerede über KI derzeit nur verwirrt, dann könnte dieses visuelle Video genau der Balsam sein, den Sie brauchen. Mithilfe eines neuronalen Netzwerks und Reinforcement Learning, YouTuber Josch Begab sich auf eine dreijährige Reise, um einen KI zu trainieren, um seine eigene 17-jährige Trackmania-Erfahrung zu ersetzen.
Die Prämisse ist einfach: Trainieren Sie eine KI, um das Spiel zu verbessern, und wie Yosh selbst es ausdrückt: „Je mehr sie trainiert, desto besser wird sie.“ Dies ist auch nicht Yoshs erstes Rodeo: Er hat in früheren Videos mit der Technologie experimentiert und versucht, eine Trackmania-KI zu entwickeln, die in der Lage ist, sich selbst zu schlagen. Sein YouTube-Kanal hat weltweit über 18 Millionen Aufrufe und knapp 100.000 Abonnenten.
Das neuronale Netzwerk wird im Video als „mathematisches Werkzeug beschrieben, das grob modelliert, wie ein Gehirn funktioniert“, und Parameterdaten wie Wendegeschwindigkeit und Geschwindigkeit aufnimmt und als Reaktion darauf dem Auto Anweisungen gibt, was es tun soll. Je mehr es abgespielt wird, desto mehr Daten werden gesammelt, um die Leistung zu optimieren. Alle von der KI ergriffenen Maßnahmen, die als vorteilhaft eingeschätzt wurden, bescherten ihr eine Belohnung. Dieses verstärkende Lernen führte zu schnelleren Entscheidungen und effizienteren Entscheidungen.
Das ehrwürdige Trackmania ist nahezu der perfekte Mittelpunkt für einen solchen Ansatz: einfache und klare Regeln für Strecken und Bewegungen, kombiniert mit einem Trial-and-Error-Spielstil, der selbst durch übereinander geschichtliche Wiederholungen visualisiert wird. Die Aufnahmen von Hunderten von Autos, die versuchen, scheitern und lernen, Fortschritte zu machen, machen den gesamten Lernprozess leicht verständlich. Es ist auch äußerst befriedigend anzusehen.
Yosh startete die KI auf einer einfachen Strecke, und im Laufe der Entwicklung werden komplexere Strecken sowie die Option zum Bremsen eingeführt, die ursprünglich weggelassen wurde. Diese zusätzliche Bremsfähigkeit wurde eingeführt, um das Driften und damit schnellere Zeiten zu fördern. Um dies zu erreichen, wurde zunächst jede Art von Drift belohnt, was ein Fehler war: Die KI schaffte es, ihren Schöpfer zu überlisten und einen Weg zu finden, ständig zu driften, was zu reichlich positivem Feedback für das Modell, aber einer niedrigen Höchstgeschwindigkeit führte. Dieses unbeabsichtigte Verhalten wurde durch eine einfache Geschwindigkeitsanforderung behoben, sodass nur das Driften über einer bestimmten Geschwindigkeit belohnt wurde.
Der Fortschritt der KI ist im gesamten Video deutlich zu erkennen, und ich war mir schnell darüber im Klaren, wie weit sie vorangetrieben werden könnte. Wenn Sie herausfinden möchten, ob es wirklich unschlagbar geworden ist, schließen Sie sich den Millionen von uns an, die es gesehen haben, und überzeugen Sie sich selbst: Und wenn Sie einfach nur den Showdown zwischen Mensch und Maschine sehen möchten, finden Sie hier den Zeitstempel.