Der Traum, dass ein Roboter Ihnen das Frühstück zubereitet, Ihre Aufgaben übernimmt oder mehr als ein typischer Staubsaugerroboter erledigt, könnte dank uns einen Schritt näher kommen neue Forschung aus Googles KI-Labor DeepMind.
Drei neue Forschungsarbeiten von DeepMind zu Automatisierung, Reaktionszeiten und Bewegungsverfolgung bei Robotern ermöglichen ihnen ein effizienteres Arbeiten in der realen Welt.
Die Techniken ermöglichen es den Robotern, leistungsstarke große Sprachmodelle wie das ChatGPT-Modell zu verwenden, um komplexe Aufgaben kennenzulernen und zu verstehen, ohne dass sie für jede neue Funktion von Grund auf trainiert werden müssen.
Robotern ein Gehirn und eine Konstitution geben
In einer Reihe von Videos, die das Potenzial der Forschung zeigen, ist zu sehen, wie die Roboter Getränkedosen aufheben, Schubladen öffnen und schließen und sogar eine Oberfläche reinigen.
Bisher waren für jeden einzelnen Teil dieser Aufgaben Codezeilen und spezielle Schulungen erforderlich. Die neue Forschung ermöglicht es den Bots, zu lernen, indem sie die Umgebung beobachten, untersuchen und die Aufgabe in Echtzeit selbst erledigen.
Es gibt auch eine neue Roboterverfassung, die Sicherheitsregeln sowohl für die Bots als auch für das zugrunde liegende Entscheidungssystem für große Sprachmodelle festlegt. Basierend auf Isaac Asimovs berühmten drei Gesetzen der Robotik heißt es im Wesentlichen, dass man Menschen keinen Schaden zufügen soll.
AutoRT gibt Robotern Visionen
Die erste der neuen Technologien ist AutoRT, eine Technik, die mehreren Robotern gleichzeitig beibringt, verschiedene Aufgaben in verschiedenen Umgebungen gleichzeitig auszuführen.
Sie verwenden ein visuelles Sprachmodell, um die Umgebung und Objekte zu untersuchen und diese Daten in ein großes Sprachmodell einzuspeisen. Dieses Modell fungiert als Entscheidungsträger für den Bot und sagt ihm, welche Aufgabe er als nächstes ausführen soll und wie diese Aufgabe ausgeführt werden soll.
Dieses System wurde sieben Monate lang getestet und zum Trainieren von 20 Robotern eingesetzt. Insgesamt führten sie während des Trainingszeitraums 6.650 Einzelaufgaben durch, um die Datenerfassung und -verarbeitung zu verfeinern.
SARA lässt die Roboter selbst Änderungen vornehmen
Self-Adaptive Robust Attention for Robotics Transformers (oder kurz SARA-RT) ist ein neues System, das skalierbar ist und es den Robotern ermöglicht, ihre Anweisungen basierend auf realem Feedback zu verbessern. Dies ist eine Möglichkeit, das Modell so zu optimieren, dass es so effizient wie möglich arbeitet.
Der Roboter kann räumliche Daten von seinen Kameras und Informationen von anderen Sensoren aufnehmen und diese nutzen, um den besten Weg zur Erledigung einer bestimmten Aufgabe auszuwählen.
Die letzte Technik stellt visuelle Konturdaten für Roboter bereit, die den Trainingsdaten Beschreibungen hinzufügen können. Diese zusätzlichen Daten kann es nutzen, um effektiver zu verallgemeinern und sein Verständnis der Aufgabe, die es ausführen muss, zu verbessern.
Dies ist nur ein frühes Forschungsprojekt von DeepMind, bei dem an der zugrunde liegenden Technologie gearbeitet wird, anstatt sie in Live-Produkten einzusetzen. Erwarten Sie also nicht, dass ein Android Ihnen bald einen Kaffee kocht.