Googles neues KI-Modell steuert Roboter


Vergessen Sie die KI, die Bilder zeichnen kann, das neueste KI-Modell von Google kann einen Roboter steuern.

Am Freitag stellte Google Robotics Transformer 2 (RT2) vor, ein Vision-Language-Action (VLA)-Modell, das Text und Bilder aufnehmen und in Roboteraktionen umwandeln kann.

„So wie Sprachmodelle anhand von Texten aus dem Web trainiert werden, um allgemeine Ideen und Konzepte zu lernen, überträgt RT-2 Wissen aus Webdaten, um das Verhalten von Robotern zu beeinflussen“, sagt Vincent Vanhoucke, Leiter Robotik bei Google DeepMind. erklärt in einem Blogbeitrag(Öffnet in einem neuen Fenster). „Mit anderen Worten: RT-2 kann Roboter sprechen.“

Vanhoucke sagt, dass Chatbots zwar trainiert werden können, indem man sie mit Informationen zu einem Thema versorgt, Roboter aber noch einen Schritt weiter gehen und sich in der realen Welt „erden“ müssen. Als Beispiel nennt er einen roten Apfel. Während Sie einem Chatbot einfach erklären könnten, was ein Apfel ist, muss ein Roboter alles darüber wissen und wissen, wie er ihn von einem ähnlichen Gegenstand – zum Beispiel einem roten Ball – unterscheiden kann, und er muss auch lernen, wie er das macht sollte den Apfel aufheben.

RT-2 geht noch einen Schritt weiter Googles RT-1(Öffnet in einem neuen Fenster) und andere Modelle mithilfe von Daten aus dem Internet. Wenn Sie beispielsweise möchten, dass ein Vorgängermodell etwas wegwirft, müssen Sie ihm beibringen, was Müll ist und wie man ihn verwendet. Bei RT-2 haben Sie vielleicht nicht erklärt, was der Müll ist und wie man ihn verwendet, aber der Roboter kann diesen Teil mithilfe von Webdaten selbst herausfinden.

Von unseren Redakteuren empfohlen

Mit RT-2 sind Roboter in der Lage, zu lernen und erlerntes Wissen auf zukünftige Situationen anzuwenden. Allerdings weist Google darauf hin, dass RT-2 in der aktuellen Form aufgrund der Einschränkungen nur dazu beitragen kann, dass ein Roboter bessere physische Aufgaben erledigt, die er bereits beherrscht, und sie nicht von Grund auf erlernen kann.

Dennoch ist es ein großer Fortschritt und zeigt uns, was in Zukunft möglich sein könnte. Weitere Informationen finden Sie bei Google geht in seinem DeepMind-Blog ausführlich auf die Funktionsweise von RT-2 ein(Öffnet in einem neuen Fenster).

Was ist jetzt neu?<\/strong> um unsere Top-Storys jeden Morgen in Ihren Posteingang geliefert zu bekommen „:“2022-08-31T18:35:20.000000Z“, „created_at“:null, „updated_at“: „2022-08-31T18:35:24.000000Z“)“ x-show=”showEmailSignUp()”-Klasse =”rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs”>

Holen Sie sich unsere besten Geschichten!

Melden Sie sich an für Was ist jetzt neu? um jeden Morgen unsere Top-Storys in Ihren Posteingang zu bekommen.

Dieser Newsletter kann Werbung, Angebote oder Affiliate-Links enthalten. Wenn Sie einen Newsletter abonnieren, erklären Sie sich damit einverstanden Nutzungsbedingungen Und Datenschutz-Bestimmungen. Sie können den Newsletter jederzeit abbestellen.



source-106

Leave a Reply