MIT-Ingenieure entwickeln mithilfe von Algorithmus und Sprach-KI einen Roboter, der eigenständig Fehler korrigieren kann

Künftige Roboter sollen dank MIT-Algorithmus und einer LLM-KI weniger fehleranfällig werden – und die Entwickler nicht mehr so viel Zeit und Nerven kosten.

Können wir vielleicht doch eines Tages Roboter kaufen, die für uns den Haushalt machen können? (sizsus, Adobe Stock) Können wir vielleicht doch eines Tages Roboter kaufen, die für uns den Haushalt machen können? (sizsus, Adobe Stock)

Wie können wir kleine Roboterhelfer so programmieren, dass sie von uns lernen und Fehler selbständig korrigieren? MIT-Ingenieure haben darauf eine geniale Antwort.

Sie zeigen den Robotern erst physische Bewegungsabläufe und verbinden sie anschließend mit einer künstlichen Intelligenz in Form eines Sprachmodells (LLMs).

Die KI erkennt dann anhand eines Algorithmus die Position des Roboters und versteht, in welchem semantischen Teilbereich einer Aufgabe sich der Roboter befindet. So sollen künftige Roboter noch smarter werden und eigene Fehler selbständig einschätzen und korrigieren.

Nachahmung und Sprachmodelle als Schlüssel zum Erfolg

Nachahmungslernen ist ein gängiger Ansatz für Haushaltsroboter. Aber wenn ein Roboter blind die Bewegungsabläufe eines Menschen nachahmt, können sich winzige Fehler ansammeln und schließlich den Rest der Ausführung zum Scheitern bringen. Mit unserer Methode kann ein Roboter Ausführungsfehler selbst korrigieren und den Gesamterfolg der Aufgabe verbessern.

Das sagt Yanwei Wang in der MIT-Mitteilung. Er ist Doktorand am MIT Department of Electrical Engineering and Computer Science (EECS). Doch der Reihe nach.

Das Experiment: Einem Roboter wird eine einfache Aufgabe gestellt. Dieser soll mithilfe einer Kelle Murmeln aus einer Schüssel A schöpfen und anschließend in Schüssel B ausschütten.

So funktionierts: Zuerst zeigen die Wissenschaftler dem Roboter den physischen Bewegungsablauf – also schöpfen, bewegen und ausschütten - in einer durchlaufenden und fluiden Bewegung, wie wir Menschen es machen würden.

Der Nachteil dieser klassischen Lernmethode: Passieren dem Roboter irgendwo in dieser Bewegung Fehler, müsste er wieder am Start der gelernten Bewegung anfangen.

Oder: Die fluide Bewegung wird durch die Ingenieure nachträglich in möglichst viele Teilaufgaben und -Bereiche unterteilt.

Nur so kann der Roboter so nah wie möglich vor seiner fehlerhaften Teilaufgabe wieder in den Bewegungsablauf einsteigen – ohne die Garantie, dass der Fehler so behoben wird. Eine Vorgehensweise, die in der Entwicklung sehr zeitaufwendig sein kann.

Der Clou: Statt eines Menschen erkennt und beschreibt jetzt eine lernende KI den physischen Zustand und Bewegungsablauf des Roboters. So heißt es im Beitrag vom MIT:

Die Forscher fanden heraus, dass ein LLM zusätzlich zu Sätzen und Absätzen aufgefordert werden kann, eine logische Liste von Teilaufgaben zu erstellen, die zu einer bestimmten Aufgabe gehören. Wenn ein LLM beispielsweise aufgefordert wird, die Handlungen aufzulisten, die beim Schöpfen von Murmeln aus einer Schale in eine andere erforderlich sind, könnte es eine Folge von Verben wie "greifen", "schöpfen", "transportieren" und "schütten" produzieren.

Für Interessierte: LLM bedeutet Large Language Model. Das ist eine Form der künstlichen Intelligenz, welche Techniken des maschinellen Lernens nutzt, um menschliche Sprache zu verstehen und zu erzeugen. Das bekannteste Beispiel hierfür ist ChatGPT.

Die MIT-Ingenieure sparen also jede Menge Zeit (und Nerven), dem Roboter zu helfen und Lösungen zu beschreiben, wie er seine Fehler korrigieren sollte. Für diesen Ansatz entwickelten das Team einen Algorithmus, der die Positionen des Roboters im physischen Raum oder in einem Bild erkennen kann.

Diese Zuordnung der physischen Koordinaten bezeichnen sie als Grounding, also Erdung. Die KI erkennt so, in welcher semantischen Teilaufgabe sich ein Roboter gerade befindet: Zum Beispiel beim Schöpfen von Murmeln.

Mit unserer Methode müssen wir, wenn der Roboter Fehler macht, keine Menschen bitten, zu programmieren, oder extra Demonstrationen geben, wie man sich von Fehlern erholt. Das ist sehr aufregend, denn es werden derzeit große Anstrengungen unternommen, um Haushaltsroboter mit Daten zu trainieren, die von Teleoperationssystemen gesammelt wurden. Unser Algorithmus kann diese Trainingsdaten nun in robustes Roboterverhalten umwandeln, das trotz externer Störungen komplexe Aufgaben erfüllen kann.

Das ist also eine sinnvolle KI-Ergänzung einer Aufgabe. Doch künstliche Intelligenzen werden nicht immer für gute Zwecke benutzt. Aktuell gibt es eine heiße Debatte, inwiefern ChatGPT dazu missbraucht wird, wissenschaftliche Studien zu schreiben.

Es bleibt also spannend, ob wir in Zukunft noch klügere Haushaltsgehilfen bekommen, die vielleicht eines Tages für uns komplizierte Aufgaben wie das Kochen eines mehrteiligen Menüs übernehmen können.

Was denkt ihr über die Kombi aus Sprach-KI und Roboter? Schreibt es gerne in die Kommentare.

zu den Kommentaren (3)

Kommentare(3)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.