2 Bewertungen

Machine Learning KI für selbstfahrende Autos

Elektrobit nutzt bei der Entwicklung selbstlernender Fahrzeuge die neueste Generation von Deep-Learning-Technologien. Diese nutzen Belohnungsstrategien – sogenanntes Reinforcement Learning.

Bild: Elektrobit
10.10.2017

Eine der großen Schwierigkeiten für das autonome Fahren ist die Unstrukturiertheit des Verkehrs. Um sie zu bewältigen, sind gut trainierte KI-Systeme notwendig. Wie sich diese umsetzen lassen, erfahren Sie hier.

In der Entwicklung softwarebasierter Systeme ist Machine Learning einer der wichtigsten Trends. Laut einer Studie des US-Technologieunternehmens Narrative Science nutzen schon heute 40 Prozent aller Unternehmen auf die eine oder andere Weise Künstliche Intelligenz (KI). Bis 2018 soll der Anteil sogar auf 60 Prozent steigen.

Machine Learning ist eine wichtige Teildisziplin der KI. Dabei treffen Algorithmen Entscheidungen oder Voraussagen auf Basis vorheriger Lernprozesse. Das Grundprinzip ist seit Jahrzehnten bekannt, jedoch sind seine Einsatzmöglichkeiten sowie die Qualität der Resultate in den vergangenen Jahren massiv gewachsen. Zu verdanken ist diese Entwicklung zum einen der stark gestiegenen Rechenleistung und zum anderen der Weiterentwicklung der genutzten Algorithmen.

Große Fortschritte bei der KI dank Deep Learning

Erhebliche Fortschritte brachte das Konzept „Deep Learning“, bei dem die Interpretation von Daten nicht mehr durch Programmierer endgültig festgelegt wird. Stattdessen lernen entsprechende Systeme selbständig auf Basis geeigneter Trainingsdaten. So gelingt es Deep-Learning-Algorithmen, Muster in großen Datenmengen zu erkennen und daraus für sich selbst eine komplexere innere Struktur zu entwickeln. Diese Architektur ermöglicht bereits heute beeindruckende Ergebnisse. Zu den bereits auf dem Markt verfügbaren KI-Anwendungen zählen etwa das Erkennen natürlicher Sprache oder virtuelle Agenten für persönliche Assistenzfunktionen.

KI-Systeme haben sich in jüngerer Zeit bereits sehr erfolgreich mit menschlichen Gegnern gemessen. Im März 2016 schlug zum Beispiel das KI-Programm AlphaGo einen professionellen Gegenspieler im Brettspiel Go. Das zwischenzeitlich von Google aufgekaufte KI-System DeepMind ist in der Lage, 49 klassische Atari-Videospiele erfolgreich zu bewältigen. Wie jede KI-Software lernen die genannten Systeme dabei aus Erfolg und Misserfolg.

Machine und Deep Learning wichtig für die Entwicklung autonomer Fahrzeuge

Diese Fortschritte beweisen, dass Künstliche Intelligenz in der Lage ist, extrem komplexe Aufgabenstellungen erfolgreich zu bewältigen. Daher liegt der Gedanke nahe, sie auch im Kontext des hochautomatisierten Fahrens einzusetzen. Tatsächlich wurden hier im Rahmen von Forschungsprojekten schon vielversprechende Resultate erzielt. Für einen kommerziellen Einsatz müssen allerdings noch weitere Herausforderungen bewältigt werden – insbesondere in Hinsicht auf die funktionale Sicherheit. Dennoch gelten Machine Learning und Deep Learning als wichtige Werkzeuge bei der Entwicklung autonomer Fahrzeuge. Elektrobit konzentriert sich in diesem Zusammenhang derzeit auf die Erforschung und Entwicklung von zwei Anwendungsfällen: Die Erkennung von Verkehrszeichen und die Steuerung des Fahrzeugs.

Die größte Herausforderung des realen Straßenverkehrs ist, dass es sich um eine ausgesprochen unstrukturierte Umgebung handelt. Um dieses Problem zu lösen, zerlegen die Entwickler typischerweise die komplexe Gesamtsituation in einfacher strukturierte Teilaufgaben. Zwar erlauben Deep-Learning-Mechanismen grundsätzlich auch Ende-zu-Ende-Ansätze, bei denen eine Dekomposition der Problemstellung in kleinere Bausteine gar nicht mehr erforderlich ist. Jedoch schätzen wir diese Vorgehensweise zum gegenwärtigen Zeitpunkt als weniger geeignet ein, weil sie die Möglichkeiten für Testing und Validierung einschränkt. Das Zerlegen des hochkomplexen Gesamtsystems Straßenverkehr in Einzelbausteine mit klar definierten Schnittstellen vereinfacht die Analyse, die Entwicklung und den Test von KI-Systemen dagegen wesentlich.

KI verhält sich wie Blackbox

Dennoch braucht die Nutzung von Machine Learning auch bei der Entwicklung und beim Testing neue Ansätze. Während traditionelle Softwarekomponenten gegen konkrete Anforderungen getestet werden, verhalten sich KI-Systeme und ihre stochastischen Lernstrategien wie eine Blackbox. Eine Vorhersage, wie und in welcher Struktur das System lernt, ist praktisch nicht möglich. Auch beim Testing hilft eine Unterteilung in einfachere Teilaufgaben die Komplexität der KI-Lösungen und ihrer Aufgabenstellungen zu reduzieren.

Elektrobit nutzt bei der Entwicklung selbstlernender Fahrzeuge die neueste Generation von Deep-Learning-Technologien. Diese nutzen Belohnungsstrategien – sogenanntes Reinforcement Learning. Der Lernprozess der Software wird dabei durch ein Belohnungssystem gesteuert, welches es ermöglicht, für die gestellten Aufgaben eine unabhängige Lösungsstrategie zu entwickeln. Das Design solcher Systeme erfordert allerdings detailliertes Wissen über das jeweilige Anwendungsgebiet.

Die drei Klassen des Machine Learning

Grundsätzlich lässt sich Machine Learning nach den Lernbedingungen in drei verschiedene Klassen einteilen:

  • Bei überwachtem Lernen steht das erwünschte Ergebnis im Vorfeld fest. Der Algorithmus lernt, aus den Input-Daten die korrekte Entscheidung abzuleiten.

  • Bei unüberwachtem Lernen sind die Input-Daten nicht gekennzeichnet beziehungsweise strukturiert – Aufgabe des Algorithmus ist es, Strukturen und Eigenschaften der bereitgestellten Daten zu analysieren und zu identifizieren.

  • Bei sogenanntem halbüberwachtem Lernen sind die Input-Daten ebenfalls nicht vorstrukturiert oder gekennzeichnet. In diesem Fall erhält der Algorithmus die Aufgabe, aus einer zur Verfügung stehenden Anzahl von Aktionen die bestmögliche auszuwählen und auf diese Weise mit seiner Umgebung zu interagieren. Dieses Konzept wurde auch bei dem eingangs erwähnten Beispiel eingesetzt, bei dem das KI-System DeepMind das erfolgreiche Spielen von Atari-Videogames erlernte. Auch für die „Fahrschule für Algorithmen“ kommt halbüberwachtes Lernen zum Einsatz.

Rennsimulator bildet Basis für Deep-Learning-System

Um dem Algorithmus das „Auto fahren“ in einem sicheren Umfeld beizubringen, realisierten Elektrobits Softwareingenieure ein Deep-Learning-System auf Basis des als Open-Source-Software angebotenen Autorenn-Simulators Torcs. Die Game-Engine generiert Bewegtbilder, die sich zur Objekterkennung nutzen lassen; und stellt gleichzeitig weitere Daten zur Verfügung, wie etwa die aktuelle Geschwindigkeit des zu steuernden Fahrzeugs, dessen relative Position auf der Straße und den Abstand zu vorausfahrenden Autos. Alle diese Bilder und Daten dienen als Input für das KI-System. Das System leitet daraus Fahrstrategien und die erforderlichen Steuerkommandos für das automatisiert fahrende Auto ab, um so mit der virtuellen Umgebung zu interagieren.

Der Simulator Torcs unterstützt eine Vielzahl von Fahrzeugen und Strecken, wodurch dem Deep-Learning-Algorithmus ein größeres Angebot an Einsatzumgebungen und Situationen zur Verfügung steht – und somit ein breiteres Spektrum an Input-Daten. Aus technischer Sicht handelt es sich bei dem gewählten Algorithmus um ein tief gefaltetes neuronales Netz (Deep Convolutional Neural Network, kurz DNN), das durch positive Belohnungssignale trainiert wird.

Seine Funktionsweise lässt sich an einem Beispiel verdeutlichen: In einer bestimmten Situation der Simulation stehen vier mögliche Aktionen zur Auswahl – beschleunigen, abbremsen, nach links steuern oder nach rechts steuern. Das DNN berechnet, anhand einer sogenannten Q-Funktion, welche dieser vier Optionen es als die optimale Reaktionen auf die aktuelle vorliegenden Situation einschätzt. Die getroffene Entscheidung führt dann zu einer Zustandsänderung des Simulators - das Spiel reagiert auf die Steuerung durch den Algorithmus. Ist der so herbeigeführte Zustand positiv zu bewerten, erhält das KI-System eine entsprechende Rückmeldung mit Belohnung. Hat das Fahrzeug beispielsweise beschleunigt, ohne mit anderen Fahrzeugen zu kollidieren, wird diese Entscheidung belohnt und somit im neuronalen Netz verstärkt. Bei ungünstigem Ergebnis erfolgt dagegen keine Belohnung. Das System wird dadurch von dem gewählten Entscheidungsweg für die Zukunft abgeschreckt.

Passendes KI-Netz auswählen

Elektrobit setzt für diese Entwicklungsumgebung die hauseigenen Produkte EB Cadian und EB Robinos ein. Ersteres dient zur Analyse von Schwarmdaten aus weltweit verteilten Fahrzeugflotten, die mittels etablierten Standards wie beispielsweise ODX und UDS gesammelt werden. Im Zusammenhang mit Machine Learning können die Daten von EB Cadian beispielsweise für Predictive-Maintenance verwendet werden.

EB Robinos ist eine Entwicklungsumgebung und ein Framework für komplexe Anwendungen im Bereich des autonomen Fahrens. Innerhalb seiner Module werden an verschiedenen Stellen Machine-Learning-Methoden genutzt, um komplexe Aufgaben zuverlässig zu lösen. Bislang entwickelte Prototypen haben mit den beschriebenen Mechanismen bereits sehr gute Erfolge bei der Lösung der komplexen Aufgabenstellung Straßenverkehr erzielt. Als entscheidend hat sich dabei erwiesen, das für die jeweilige Aufgabenstellung passende neuronale Netz auszuwählen.

Verbleibende Herausforderungen sind insbesondere die Anforderungen an die funktionale Sicherheit von Systemen, die auf Machine Learning basieren, sowie die Entwicklung geeigneter Test- und Validierungskonzepte. Trotz dieser Herausforderungen setzt Elektrobit darauf, dass Machine Learning in Zukunft für hochautomatisiertes Fahren eine entscheidende Rolle spielen wird. Die auf diesem Gebiet bereits erzielten Ergebnisse sind jedenfalls vielversprechend.

Firmen zu diesem Artikel
Verwandte Artikel