S-Bahn-Fahrt wird smart – durch schnelle Twitter-Auswertung
Hannover/Potsdam – Forscher des Potsdamer Hasso-Plattner-Instituts (HPI) präsentieren auf der CeBIT (Halle 6, Stand D18) eine neue Analysesoftware, die jede S-Bahn-Fahrt smart machen kann. Durch blitzschnelle Auswertungen von Einträgen im Kurznachrichtendienst Twitter zeigen die Forscher, wie sich künftig Millionen von Nahverkehrs-Kunden auf Unregelmäßigkeiten besser einstellen können. Gemeinsam mit der S-Bahn Berlin arbeitet das HPI daran, auftretende Beeinträchtigungen in Echtzeit zu analysieren. So kann z.B. erkannt werden, welche Verkehrsereignisse zu welcher Zeit an bestimmten Orten gehäuft auftreten und gemeldet werden, um frühzeitig darauf reagieren zu können.
„Für Verkehrsunternehmen sind solche Auswertungen wichtig, bedeuten heutzutage jedoch sehr hohen Aufwand bei der Datenanalyse“, erläutert HPI-Direktor Prof. Christoph Meinel. Dank des HPI-Systems könne künftig sowohl schon bei der Verkehrsplanung als auch im laufenden Betrieb besser auf Engpässe und Unregelmäßigkeiten und deren Auswirkungen reagiert werden. Einen besonderen Vorteil erhoffen sich Wissenschaftler und Praktiker von der Möglichkeit, aus vergangenen Vorkommnissen aktuelle Ereignisse besser einschätzen zu können.
„Ziel ist es, frühzeitig Alternativen zu erkennen, wenn plötzliche Störungen im Ablauf des öffentlichen Nahverkehrs Reisepläne aus dem Takt zu bringen drohen“, erläutert HPI-Projektleiter Dr. Matthieu-P. Schapranow. Er setzt zur permanenten Analyse von Tweets über aktuelle Betriebsstörungen mit seinem Team die am HPI erforschte In-Memory Database Technology ein. Sie ermöglicht es unter anderem, von Menschen geschriebene Texte in computerverständliche Informationen zu übersetzen. Damit können dank paralleler Verarbeitung selbst riesige Datenmengen in blitzschnell analysiert und ausgewertet werden.
„Aus den Twitter-Kurznachrichten der S-Bahn extrahieren wir so zum Beispiel Informationen über betroffene Linien, Bahnhöfe oder Gründe, verknüpfen diese und errechnen in Echtzeit Prognosen für künftige Ereignisse“, erklärt Schapranow. Die HPI-Software könne jederzeit in Live-Statistiken anzeigen, was die häufigsten Arten von Vorfällen sind und zu welchen Tageszeiten welche Ereignisse für welche Linien besonders oft gemeldet werden. Nutzt ein Anwender die Informationen, welche die S-Bahn Berlin den Kunden bereitstellen will, kann er sich angesichts der jeweiligen Situation auf die Wahl der Route und des Verkehrsmittels einstellen, um mit möglichst geringem Zeitverlust ans Ziel zu kommen. „Fahrgäste, denen mehreren Routen zur Wahl stehen, können künftig diejenige wählen, für die die geringste Wahrscheinlichkeit für störende Ereignisse prognostiziert wurde“, sagt Schapranow.
Herausforderung für die Informatiker am HPI ist die sofortige Analyse der unstrukturierten Texte, deren Kombination mit historischen Daten, sowie deren interaktive Exploration. Erste Erkenntnisse aus der Analyse zehntausender Tweets der Berliner S-Bahn seit Mitte 2013 ergaben bisher: Gut die Hälfte gibt Hinweise auf Ereignisse im Betriebsablauf. Meistens handelt es sich um Ausfälle oder Verspätungen von Zügen. Am häufigsten genannter Grund ist der „Polizeieinsatz“, gefolgt von „Notarzteinsatz“.
Die HPI-Wissenschaftler, deren Institut in unmittelbarer Nähe des S-Bahnhofs Griebnitzsee auf der Strecke Berlin-Potsdam liegt, brachten ihrer Softwareanwendung bei, selbst verschiedene Deklinationsformen, Abkürzungen und Umlautschreibweisen von Stichwörtern zu erkennen. Mit der sogenannten „fuzzy search“ oder unscharfen Suche werfen selbst Rechtschreibfehler in Tweets die clevere Potsdamer Analyse-Software nicht aus der Bahn. Diese Methode vergleicht zwei Wörter buchstabenweise, berechnet einen Ähnlichkeitswert und beurteilt danach, wie wahrscheinlich die Übereinstimmung mit einem relevanten Stichwort ist.
Quelle: ots