Ansatz für sichere selbstlernende Robotersteuerung Laufen lernen mit hybrider KI

Der humanoide Roboter „RH5“ wurde am DFKI Robotics Innovation Center entwickelt.

Bild: DFKI, Annemarie Popp
25.06.2024

Die neuesten Entwicklungen in der Robotik, die auf datengestützter Künstlicher Intelligenz basieren, eröffnen ein breites Spektrum an praktischen Anwendungen. Die Sicherheit dieser Anwendungen zu gewährleisten, ist aber nach wie vor eine wichtige Aufgabe. Das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) in Bremen hat deshalb neue Steuerungsmethoden für komplexe Systeme entwickelt, damit lassen sich die Vorteile schnellen Lernens mit der Zuverlässigkeit mathematischer Verifikation verbinden.

Mit den Fortschritten auf dem Gebiet der subsymbolischen Künstlichen Intelligenz, wie dem Deep Learning, werden auch die Grenzen datenbasierter Verfahren in Bezug auf Sicherheit und Zuverlässigkeit immer deutlicher. Denn Entscheidungen, die durch maschinelles Lernen getroffen werden, basieren weder auf symbolischen Berechnungen noch sind sie durch logische Regeln erklärbar und damit mathematisch nicht beweisbar. Gerade in sicherheitskritischen Bereichen wie der humanoiden Robotik ist die Verifizierbarkeit jedoch entscheidend, um das Risiko von Fehlfunktionen zu minimieren und eine sichere Umgebung zu gewährleisten.

Komplexes Roboterverhalten lernen und verifizieren

Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts „VeryHuman“ haben DFKI-Wissenschaftlerinnen und -Wissenschaftler daher einen neuen Ansatz entwickelt, der subsymbolische und symbolische KI-Methoden kombiniert. Konkret nutzten sie symbolische Spezifikationen im Reinforcement Learning, bei dem ein System für mathematisch überprüfbare Ergebnisse belohnt wird.

Dafür bündelten die zwei Bremer Forschungsbereiche Robotics Innovation Center, geleitet von Prof. Dr. Frank Kirchner, und Cyber-Physical Systems, geleitet von Prof. Dr. Rolf Drechsler, ihre Kompetenzen. Ziel war es, ein KI-basiertes Steuerungssystem für humanoide Roboter zu entwickeln, mit der menschenähnliche Fähigkeiten wie sicheres und stabiles Laufen oder andere komplexe Bewegungen erreicht werden können.

Belohnungsfunktionen aus symbolischen Beschreibungen

Durch die Verwendung symbolischer Spezifikationen, wie einer einfachen Sprache zur Beschreibung des Roboterverhaltens, ist es dem Projektteam gelungen, abstrakte kinematische Modelle zu erstellen, die mathematisch überprüft werden können. Diese Abstraktionen definieren Belohnungsfunktionen für das Reinforcement Learning und ermöglichen es dem Roboter, seine Entscheidungen anhand der Modelle zu verifizieren.

Dadurch wird die Zuverlässigkeit der Entscheidungen erhöht, was stabile und vorhersehbare Roboterbewegungen gewährleistet und das Risiko von Fehlverhalten oder unerwarteten Aktionen minimiert. Zusätzlich wurde das gewünschte Roboterverhalten als hybrider Automat modelliert, ein mathematisches Modell, das sowohl kontinuierliches als auch diskretes Verhalten beschreibt. Dies reduziert den Zustandsraum des Systems und ermöglicht so ein effizienteres Lernen.

Schnelles dynamisches Laufen mit dem humanoiden Roboter RH5

Darüber hinaus ist es den Forschenden im Rahmen des Projekts gelungen, dynamisches Laufen mit dem humanoiden Roboter „RH5“ des DFKI zu realisieren. Dazu kombinierten sie die Methode des Nullmomentpunktes (der Punkt auf der Standfläche eines Roboters, an dem die resultierende Bodenkraft kein Kippmoment erzeugt) mit dem Ansatz der Ganzkörperregelung.

Diese Kombination ermöglicht die Maximierung der Stabilität und Leistungsfähigkeit von lagegeregelten Robotern. Dadurch konnte robustes dynamisches Laufen bei unterschiedlichen Geschwindigkeiten und Schrittlängen unter effektiver Ausnutzung der Systemgrenzen sowohl hinsichtlich der Geschwindigkeit als auch des Bewegungsumfangs erreicht werden.

Mehr Effizienz und Sicherheit für KI-Anwendungen

Nach Kenntnis der Forschenden ist dies das erste Mal, dass ein humanoider Roboter dynamisch mit bis zu 0,43 m/s gelaufen ist. Sieht man von Systemen mit aktiven Zehengelenken ab, gehört RH5 damit zu den schnellsten Humanoiden ähnlicher Größe und Antriebsmodalitäten. Um das Verhalten von RH5 weiter zu verbessern, setzte das Team zusätzlich Algorithmen zur Simulation und optimalen Steuerung ein, die auf dem symbolischen Modell des Systems basieren.

Da die präzise Modellierung und Optimierung von Bewegungsabläufen sowohl die Sicherheit als auch die Effizienz von Robotern erhöht, kann der im Projekt entwickelte hybride KI-Ansatz als Blaupause für die Generierung von Belohnungsfunktionen aus symbolischer, logikbasierter Künstliche Intelligenz dienen. Dies ist insbesondere für Anwendungen relevant, bei denen die Systeme oder deren Fehlverhalten eine potenzielle Gefahr für den Menschen darstellen.

Verwandte Artikel