Laufen lernen mit hybrider KI

Mit den Fortschritten auf dem Gebiet der subsymbolischen Künstlichen Intelligenz, wie dem Deep Learning, werden auch die Grenzen datenbasierter Verfahren in Bezug auf Sicherheit und Zuverlässigkeit immer deutlicher. Denn Entscheidungen, die durch maschinelles Lernen getroffen werden, basieren weder auf symbolischen Berechnungen noch sind sie durch logische Regeln erklärbar und damit mathematisch nicht beweisbar. Gerade in sicherheitskritischen Bereichen wie der humanoiden Robotik ist die Verifizierbarkeit jedoch entscheidend, um das Risiko von Fehlfunktionen zu minimieren und eine sichere Umgebung zu gewährleisten.

Komplexes Roboterverhalten lernen und verifizieren

Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts „VeryHuman“ haben DFKI-Wissenschaftlerinnen und -Wissenschaftler daher einen neuen Ansatz entwickelt, der subsymbolische und symbolische KI-Methoden kombiniert. Konkret nutzten sie symbolische Spezifikationen im Reinforcement Learning, bei dem ein System für mathematisch überprüfbare Ergebnisse belohnt wird.

Dafür bündelten die zwei Bremer Forschungsbereiche Robotics Innovation Center, geleitet von Prof. Dr. Frank Kirchner, und Cyber-Physical Systems, geleitet von Prof. Dr. Rolf Drechsler, ihre Kompetenzen. Ziel war es, ein KI-basiertes Steuerungssystem für humanoide Roboter zu entwickeln, mit der menschenähnliche Fähigkeiten wie sicheres und stabiles Laufen oder andere komplexe Bewegungen erreicht werden können.

Belohnungsfunktionen aus symbolischen Beschreibungen

Durch die Verwendung symbolischer Spezifikationen, wie einer einfachen Sprache zur Beschreibung des Roboterverhaltens, ist es dem Projektteam gelungen, abstrakte kinematische Modelle zu erstellen, die mathematisch überprüft werden können. Diese Abstraktionen definieren Belohnungsfunktionen für das Reinforcement Learning und ermöglichen es dem Roboter, seine Entscheidungen anhand der Modelle zu verifizieren.

Dadurch wird die Zuverlässigkeit der Entscheidungen erhöht, was stabile und vorhersehbare Roboterbewegungen gewährleistet und das Risiko von Fehlverhalten oder unerwarteten Aktionen minimiert. Zusätzlich wurde das gewünschte Roboterverhalten als hybrider Automat modelliert, ein mathematisches Modell, das sowohl kontinuierliches als auch diskretes Verhalten beschreibt. Dies reduziert den Zustandsraum des Systems und ermöglicht so ein effizienteres Lernen.

Schnelles dynamisches Laufen mit dem humanoiden Roboter RH5

Darüber hinaus ist es den Forschenden im Rahmen des Projekts gelungen, dynamisches Laufen mit dem humanoiden Roboter „RH5“ des DFKI zu realisieren. Dazu kombinierten sie die Methode des Nullmomentpunktes (der Punkt auf der Standfläche eines Roboters, an dem die resultierende Bodenkraft kein Kippmoment erzeugt) mit dem Ansatz der Ganzkörperregelung.

Diese Kombination ermöglicht die Maximierung der Stabilität und Leistungsfähigkeit von lagegeregelten Robotern. Dadurch konnte robustes dynamisches Laufen bei unterschiedlichen Geschwindigkeiten und Schrittlängen unter effektiver Ausnutzung der Systemgrenzen sowohl hinsichtlich der Geschwindigkeit als auch des Bewegungsumfangs erreicht werden.

Mehr Effizienz und Sicherheit für KI-Anwendungen

Nach Kenntnis der Forschenden ist dies das erste Mal, dass ein humanoider Roboter dynamisch mit bis zu 0,43 m/s gelaufen ist. Sieht man von Systemen mit aktiven Zehengelenken ab, gehört RH5 damit zu den schnellsten Humanoiden ähnlicher Größe und Antriebsmodalitäten. Um das Verhalten von RH5 weiter zu verbessern, setzte das Team zusätzlich Algorithmen zur Simulation und optimalen Steuerung ein, die auf dem symbolischen Modell des Systems basieren.

Da die präzise Modellierung und Optimierung von Bewegungsabläufen sowohl die Sicherheit als auch die Effizienz von Robotern erhöht, kann der im Projekt entwickelte hybride KI-Ansatz als Blaupause für die Generierung von Belohnungsfunktionen aus symbolischer, logikbasierter Künstliche Intelligenz dienen. Dies ist insbesondere für Anwendungen relevant, bei denen die Systeme oder deren Fehlverhalten eine potenzielle Gefahr für den Menschen darstellen.

Ein Hirn für autonome Lastenräder

Neue Methode zur Bestimmung der Austauschenergie bei 2D-Materialien

Mobilitätswende: Fachkräfte rund um Antriebsbatterien weiterbilden

Katalysatoren, fein verteilt statt klumpig

Ansatz für sichere selbstlernende Robotersteuerung Laufen lernen mit hybrider KI

Komplexes Roboterverhalten lernen und verifizieren

Belohnungsfunktionen aus symbolischen Beschreibungen

Schnelles dynamisches Laufen mit dem humanoiden Roboter RH5

Mehr Effizienz und Sicherheit für KI-Anwendungen

DFKI GmbH Deutsches Forschungszentrum für Künstliche Intelligenz

KI in der Medizin

Kooperation zwischen Quantinuum und dem Hartree Centre des Science and Technology Facilities Council

AIT-Forscher Bernhard Schrenk erhält ERC Proof-of-Concept Grant

Kleinstsatelliten testen Quantenkommunikations-Technologien

European XFEL misst exotischen Materiezustand

DLR unterstützt reibungslose An- und Abreise

Ein Hirn für autonome Lastenräder

Vernetzte Fertigung optimiert den Beschaffungsprozess

Hygienic Design: Ein Muss für Industrieroboter in anspruchsvollen Umgebungen

Künstliche Intelligenz verhindert Verschwendung