Die Kommunikation auf See ist wichtig für die Sicherheit, sie funktioniert aber nicht immer reibungslos. Das kann katastrophale Folgen haben. So sind 90 Prozent aller Unfälle auf See auf menschliches Versagen zurückzuführen, die Hälfte davon auf Kommunikationsprobleme. In Zusammenarbeit mit der Jade Hochschule am Standort Elsfleth und Partnern aus der Industrie arbeitet das Fraunhofer IDMT in Oldenburg seit einiger Zeit an der Verbesserung der sicherheitsrelevanten Sprachkommunikation, insbesondere im Maritimen Umfeld.
„Neben der Entwicklung von Chatbots für Schulungszwecke und das Crewing stehen bei uns die Entwicklung von Systemen zur Überwachung von Sprachbefehlen auf der Schiffsbrücke im Fokus. Dazu haben wir die KI unseres Spracherkenners mit einem speziellen Vokabular trainiert, das als „Nautical Terms and Phrases“ oder „maritime English“ bezeichnet wird“, sagt Jan Wellmann, Leiter der automatischen Spracherkennung Institutsteil für Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer IDMT.
Elnav, ein Start-up-Unternehmen mit Sitz in der kroatischen Hafenstadt Split, entwickelt einen so genannten „Helm Order Monitor“. Dieses elektronische Gerät nutzt die Spracherkennungstechnologie des Fraunhofer IDMT in Oldenburg in Verbindung mit den von den Schiffssensoren empfangenen Daten und überwacht, ob die erteilten Befehle eindeutig sind, bestätigt und korrekt ausgeführt werden.
Hrvoje Mihovilović, Gründer und Geschäftsführer von Elnav, sagt: „Am Anfang war die größte Hürde für Elnav die Entscheidung, ob wir unser eigenes Spracherkennungssystem entwickeln oder einen Partner finden sollten. Wir brauchten einen robusten Spracherkenner, der auch unter schwierigen akustischen Bedingungen zuverlässig funktioniert. Wir entdeckten bald, dass das Fraunhofer IDMT Lösungen für die maritime Kommunikation entwickelt und somit ein idealer Partner für die Entwicklung unseres Helm Order Monitors ist.“
Technologische Herausforderungen
Die Partner standen vor drei großen technologischen Herausforderungen. Die erste war die Signalverschlechterung, die bei der Verwendung von Fernfeldmikrofonen in sprachverarbeitenden Anwendungen auftritt. Der Geräuschpegel auf der Brücke sollte die verbale Kommunikation nicht beeinträchtigen, akustische Alarme nicht überdecken und für das Brückenpersonal nicht unangenehm sein: Der Umgebungsgeräuschpegel auf der Brücke sollte bei ruhigem Wetter 65 dB(A) nicht überschreiten. Um dieses Problem zu lösen, wird die Signalverarbeitung mit Mikrofonarrays als Alternative vorgestellt.
Eine weitere Herausforderung war die Genauigkeit der automatischen Spracherkennung unter verschiedenen Geräuschbedingungen und bei unterschiedlichen Entfernungen. Um das System in lauter Umgebungen robuster zu machen, werden tiefe neuronale Netze (DNN) zur Verbesserung der Sprache eingesetzt.
Eine dritte Herausforderung war die Berücksichtigung der vielfältigen Variationen der englischen Sprache – von verschiedenen regionalen Akzenten bis hin zur eigenwilligen Verwendung von Grammatik und Vokabular. Hier wird maschinelles Lernen eingesetzt, um einen umfassenden Sprachkorpus zu erstellen, der spezifisch ist und gleichzeitig die vielen Variationen der englischen Sprache einschließt.
„Der aktuelle Bericht über die Sicherheit des europäischen Seeverkehrs (EMSAFE) sieht in der Digitalisierung und der zunehmenden Automatisierung eine große Chance. Die Technologien könnten aber auch neue Herausforderungen für die Sicherheit sowie die Fortbildung der Besatzung bringen. Die dafür notwendigen Änderungen werden durch unsere Spracherkennung unterstützt. Mit ihr kann maritimes Englisch in der Praxis erlernt, getestet und überwacht werden“, betont Dr. Jens Appell, Leiter des Oldenburger Institutsteils des Fraunhofer IDMT.