Forscher des Potsdamer Hasso-Plattner-Instituts (HPI) haben eine neue Analysesoftware entwickelt, die S-Bahn-Fahrten smart machen soll. Durch blitzschnelle Auswertungen von Einträgen im Kurznachrichtendienst Twitter zeigen die Forscher, wie sich künftig Millionen von Nahverkehrs-Kunden auf Unregelmäßigkeiten besser einstellen können. Gemeinsam mit der S-Bahn Berlin arbeitet das HPI daran, auftretende Beeinträchtigungen in Echtzeit zu analysieren. So kann beispielsweise erkannt werden, welche Verkehrsereignisse zu welcher Zeit an bestimmten Orten gehäuft auftreten. Es können zugleich Meldungen darüber erstellt werden, um frühzeitig reagieren zu können.
Herausforderung für die Informatiker am HPI ist die sofortige Analyse der unstrukturierten Texte, deren Kombination mit historischen Daten, sowie deren interaktive Exploration. Erste Erkenntnisse aus der Analyse zehntausender Tweets der Berliner S-Bahn seit Mitte 2013 ergaben bisher: Gut die Hälfte gibt Hinweise auf Ereignisse im Betriebsablauf. Meistens handelt es sich um Ausfälle oder Verspätungen von Zügen. Am häufigsten genannter Grund ist der „Polizeieinsatz“, gefolgt von „Notarzteinsatz“.
„Für Verkehrsunternehmen sind solche Auswertungen wichtig, bedeuten heutzutage jedoch sehr hohen Aufwand bei der Datenanalyse“, sagt HPI-Direktor Christoph Meinel. Dank des Systems könne künftig sowohl schon bei der Verkehrsplanung als auch im laufenden Betrieb besser auf Engpässe und Unregelmäßigkeiten und deren Auswirkungen reagiert werden. Einen besonderen Vorteil erhoffen sich Wissenschaftler und Praktiker von der Möglichkeit, aus vergangenen Vorkommnissen aktuelle Ereignisse besser einschätzen zu können.
„Ziel ist es, frühzeitig Alternativen zu erkennen, wenn plötzliche Störungen im Ablauf des öffentlichen Nahverkehrs Reisepläne aus dem Takt zu bringen drohen“, erläutert HPI-Projektleiter Matthieu-P. Schapranow. Er setzt zur permanenten Analyse von Tweets über aktuelle Betriebsstörungen die mit seinem Team erforschte In-Memory Database Technology ein. Sie ermöglicht es unter anderem, von Menschen geschriebene Texte in computerverständliche Informationen zu übersetzen. Damit können dank paralleler Verarbeitung selbst riesige Datenmengen in blitzschnell analysiert und ausgewertet werden.
Route mit geringstem Zeitverlust wählen
„Aus den Twitter-Kurznachrichten der S-Bahn extrahieren wir so zum Beispiel Informationen über betroffene Linien, Bahnhöfe oder Gründe, verknüpfen diese und errechnen in Echtzeit Prognosen für künftige Ereignisse“, erklärt Schapranow. Die HPI-Software könne jederzeit in Live-Statistiken anzeigen, was die häufigsten Arten von Vorfällen sind und zu welchen Tageszeiten welche Ereignisse für welche Linien besonders oft gemeldet werden. Nutzt ein Anwender die Informationen, welche die S-Bahn Berlin den Kunden bereitstellen will, kann er sich angesichts der jeweiligen Situation auf die Wahl der Route und des Verkehrsmittels einstellen, um mit möglichst geringem Zeitverlust ans Ziel zu kommen. „Fahrgäste, denen mehrere Routen zur Wahl stehen, können künftig diejenige wählen, für die die geringste Wahrscheinlichkeit für störende Ereignisse prognostiziert wurde“, sagt Schapranow.
Die HPI-Wissenschaftler, deren Institut in unmittelbarer Nähe des S-Bahnhofs Griebnitzsee auf der Strecke Berlin-Potsdam liegt, brachten ihrer Softwareanwendung bei, selbst verschiedene Deklinationsformen, Abkürzungen und Umlautschreibweisen von Stichwörtern zu erkennen. Mit der sogenannten „fuzzy search“ oder unscharfen Suche werfen selbst Rechtschreibfehler in Tweets die clevere Potsdamer Analyse-Software nicht aus der Bahn. Diese Methode vergleicht zwei Wörter buchstabenweise, berechnet einen Ähnlichkeitswert und beurteilt danach, wie wahrscheinlich die Übereinstimmung mit einem relevanten Stichwort ist.