Die fortschreitende Digitalisierung, leistungsfähige Hardware und KI-basierte Datenverarbeitung schaffen die Voraussetzungen für Roboter als flexible und sichere KI-Assistenten der Zukunft. Diese müssen sich an unterschiedlichste Umgebungen und Anforderungen anpassen können – sei es in der Produktion, der Logistik, der Pflege oder im Alltag. Ihre Akzeptanz hängt aber entscheidend von der Möglichkeit ab, sie individuell zu gestalten.
Genau hier setzte das inzwischen abgeschlossene Projekt M-Rock an. Als Teil der X-Rock Entwicklungen am DFKI Robotics Innovation Center baut M-Rock auf den Ergebnissen der Projekte D-Rock und Q-Rock auf und trägt zum Gesamtziel von X-Rock bei: Menschen ohne Fachkenntnisse in die Lage zu versetzen, maßgeschneiderte Roboter für ihre Anwendungen zu entwickeln.
Menschliches Feedback spielt wichtige Rolle bei der Systementwicklung
Während in D-Rock der Aufbau einer umfangreichen Datenbank modularer Roboterkomponenten im Vordergrund stand, ermöglicht der in Q-Rock entwickelte Ansatz die automatische Abbildung komplexer Hard- und Softwarestrukturen auf konkretes Roboterverhalten mittels hybrider KI-Verfahren wie Maschinellem Lernen und strukturellem Schlussfolgern.
M-Rock erweitert diesen Ansatz durch die Integration von menschlichem Feedback, um das Verhalten nicht nur softwareseitig an die individuellen Anforderungen des Benutzenden anzupassen, sondern auch eine nachträgliche Optimierung hinsichtlich des Verhaltens und der Hardwareauswahl zu ermöglichen. Damit bietet das Projekt nicht nur eine Lösung zur kontinuierlichen Anpassung von Robotern im laufenden Betrieb, sondern auch ein Werkzeug zur Personalisierung von Roboterdesign und -verhalten.
Explizites und implizites Feedback
Eine zentrale Neuerung von M-Rock ist die Kombination von explizitem Feedback, z.B. in Form von Skalenbewertungen, mit implizitem Feedback wie Hirn- und Muskelaktivität (EEG- und EMG-Daten) zur automatischen Anpassung eines Roboters an die individuellen Anforderungen und Präferenzen des interagierenden Menschen. Um die Rolle des menschlichen Feedbacks zu untersuchen, führten die Bremer Forschenden vier Studien durch. Dazu zeichneten sie die EEG-Daten von Versuchspersonen auf, die einmal Fehler im kontinuierlichen Roboterverhalten und einmal in menschlichem Verhalten beobachteten. Anschließend analysierten die Forschenden die Daten hinsichtlich des so genannten fehlerbezogenen Potenzials, das im menschlichen Gehirn beim Erkennen von Fehlverhalten ausgelöst wird.
In weiteren Studien wurde sowohl implizites als auch explizites Feedback erhoben. Zum einen bei Versuchspersonen, die das Fehlverhalten einer getragenen Ellenbogenorthese wahrnahmen, zum anderen bei der Beobachtung von Fehlverhalten an einem Pendelroboter. Die Analyse der EEG-Daten zeigte in allen Studien eine hohe Genauigkeit der fehlerbezogenen Potentialerkennung. Es konnte gezeigt werden, dass durch implizites Feedback Fehler in Echtzeit erkannt werden können – sei es bei Robotern, menschlichen Bewegungen oder Orthesen. Dies kann wiederum vom System genutzt werden, um automatisch Anpassungen vorzunehmen, ohne dass der Benutzende aktiv eingreifen muss.
Verfeinerung des Roboterverhaltens
Eine weitere Errungenschaft von M-Rock ist die Weiterentwicklung der in Q-Rock eingeführten Cognitive Cores (CCs) zu Optimal Cognitive Cores (OCCs) durch Methoden der optimalen Steuerung. OCCs ermöglichen die Generierung und Ausführung von natürlichem Verhalten für komplexe Systeme und verbessern die Interaktion mit dem Menschen durch präzise Beschreibungen der Roboteraufgaben. Sie verwenden mathematische Modelle, um optimale Lösungen für komplexe Steuerungsprobleme zu finden, wobei Faktoren wie Energieverbrauch, Zeit und Sicherheit berücksichtigt werden. In Versuchen mit dem humanoiden Roboter RH5 ist es den Forschenden gelungen, mit Hilfe von OCCs erfolgreich Tanz- und Gehbewegungen zu erzeugen.
Menschliches Feedback kann zur Verbesserung der Optimal Cognitive Cores (OCCs) und damit zur Verfeinerung des Roboterverhaltens beitragen. Es wird verwendet, um Kostenfunktionen zu erstellen, die bei der Planung optimaler Trajektorien helfen. So lernt der Roboter auf der Grundlage menschlicher Bewertungen, welche Bewegungen effizient sind, und kann besser auf dynamische Umgebungen reagieren.
Erfolgreiche Evaluierung der entwickelten Methoden
Die in M-Rock entwickelten Technologien wurden in zwei Anwendungsszenarien evaluiert. Im ersten Szenario testeten die Forschenden den sogenannten „Assist-as-Needed“-Ansatz eines Exoskeletts, das die robotische Unterstützung individuell an die Nutzenden anpasst. Die Testpersonen führten verschiedene Armbewegungen aus, während ihre Muskelaktivität (EMG-Daten) als Feedback für ein neuronales Netz zur Vorhersage der Gelenkkräfte diente. Die Ergebnisse zeigten, dass das Exoskelett in der Lage ist, die jeweiligen Fähigkeiten der Benutzenden anhand der EMG-Daten zu bewerten und sie flexibel und individuell pro Gelenk zu unterstützen.
Im zweiten Szenario lag der Fokus auf der gemeinsamen Optimierung von Verhaltens- und Designparametern eines vierbeinigen Roboters für Sprünge und Rückwärtssalti. Optimal Cognitive Cores (OCCs) halfen dabei, die Bewegungen des Roboters an die jeweilige Aufgabe anzupassen und die optimale Morphologie auszuwählen. Tests am realen System ergaben, dass längere Oberschenkel für Vorwärtssprünge und längere Unterschenkel für Rückwärtssalti die besten Ergebnisse lieferten.