Der Digit-Lagerroboter von Agility versteht dank intelligenter KI Befehle in natürlicher Sprache


Agilitätsrobotik geteilt am Mittwoch ein Demo-Video eines seiner Digit-Roboter, der mit KI aufgerüstet wurde. Auch wenn das erschreckende Bilder der Popkultur von empfindungsfähigen Science-Fiction-Maschinen heraufbeschwört, die die Welt erobern, enthüllt das Demovideo etwas viel Alltäglicheres, wenn nicht Langweiliges. Der zweibeinige Lagerroboter arbeitet mühsam daran, eine etwas rätselhafte Aufgabe zu erledigen, ohne direkte menschliche Kontrolle oder detaillierte Anleitung. In dem Clip interpretiert und führt es langsam, aber erfolgreich den Befehl aus: „Nimm die Kiste in der Farbe von Darth Vaders Lichtschwert und bewege sie zum höchsten Turm in der ersten Reihe.“

Das Unternehmen, das Digit Anfang des Jahres um einen „Kopf“ und „Hände“ erweitert hat, bietet die Demonstration als Einblick in die Art und Weise an, wie große Sprachmodelle (LLMs) seine humanoiden Maschinen verbessern können. Es deutet darauf hin, dass es eine natürliche Ergänzung ist, wenn man Digit als „eine physische Verkörperung künstlicher Intelligenz“ beschreibt.

„Wir haben einen Demoraum mit einer Reihe nummerierter Türme in verschiedenen Höhen sowie drei Boxen mit mehreren definierenden Merkmalen geschaffen“, erklärte Pras Velagapudi, Vizepräsident für Innovation und Chefarchitekt von Agility Robotics, im Clip. „Digit erhielt Informationen über diese Umgebung, jedoch keine spezifischen Informationen über seine Aufgaben. Nur Befehle in natürlicher Sprache unterschiedlicher Komplexität, um zu sehen, ob sie ausgeführt werden können.“

Standbild aus einem Demovideo des Digit-Roboters, der eine rote Kiste hält.  Eine Einblendung unten links zeigt den inneren Monolog des Roboters, während eine Einblendung unten rechts eine 3D-Karte zeigt, die der Roboter zur Navigation verwendet.Standbild aus einem Demovideo des Digit-Roboters, der eine rote Kiste hält.  Eine Einblendung unten links zeigt den inneren Monolog des Roboters, während eine Einblendung unten rechts eine 3D-Karte zeigt, die der Roboter zur Navigation verwendet.

Agilitätsrobotik

Der Clip zeigt Digits inneren Monolog Takt für Takt, eingeblendet auf dem Bildschirm, während der Roboter sich durch die Aufgabe denkt. Zum Beispiel: „Ich sollte herausfinden, welche Befehle ich verwenden kann“, „Ich sollte zuerst die Umgebung beurteilen, um zu sehen, welche Gegenstände und Orte verfügbar sind“ und „Darth Vaders Lichtschwert ist rot, und das rote Kästchen (Kästchen2) ist es auch.“ derjenige, den ich bewegen muss. Der höchste Turm in der ersten Reihe ist Tower4. Ich werde zunächst zum Standort von Box2 umziehen.“

Nachdem Digit zur Position des roten Kästchens bewegt wurde, fährt er fort. „Jetzt, wo ich am Standort von Box2 bin, sollte ich es abholen“, heißt es. Weiter heißt es: „Jetzt, da ich Box2 habe, sollte ich zum Standort des höchsten Turms in der ersten Reihe gehen, nämlich Turm4“ und „Jetzt, da ich bei Turm4 bin, sollte ich Box2 darauf platzieren.“ Abschließend erklärt es seine Arbeit für beendet: „Ich glaube, ich habe die Aufgabe abgeschlossen, da ich die Kiste in der Farbe von Darth Vaders Lichtschwert (rot, Kiste2) zum höchsten Turm in der ersten Reihe (Turm4) verschoben habe.“

Agility Robotics, das Digit vorwirft, weil es menschliche Arbeitskräfte von den anstrengendsten körperlichen Aktivitäten verschont, sagt, es habe die Demo erstellt, um „zu zeigen, wie LLMs unsere Roboter vielseitiger und schneller einsetzbar machen könnten“. Das Unternehmen baut eine Fabrik in Oregon, um jährlich 10.000 humanoide Roboter zu produzieren. Das hat es auch eingefärbt einen Vertrag mit Amazon, der es dem Einzelhändler ermöglicht, Digit in einer Einrichtung im Raum Seattle zu testen. Abgesehen von fiktionalen Ängsten ist es viel wahrscheinlicher, dass die Roboter Menschen verletzen, indem sie ihre Lagerjobs stehlen, als indem sie ihre Gestalt verändern, Unschuldige ermorden oder andere dystopische Albträume aus Hollywood nachspielen.

source-115

Leave a Reply