Big Data

Deutsche Bahn startet Informationsplattform für Reisende

24.07.2019 von Julia Lamml
Die RI-Plattform der Bahn bündelt Informationen an einem Ort. Für das Projekt arbeiten 110 Mitarbeiter mit Open-Source-Software und Diensten aus der Cloud.
Das Pilotprojekt der Bahn soll dafür sorgen, dass Reisenden überall die gleichen Informationen ausgespielt werden.
Foto: Philip Lange - shutterstock.com

Mehr als sechs Millionen Events, die täglich verarbeitet werden; 100 virtuelle Server in der AWS-Cloud, 80 getestete Microservices, nächtliche Lasttests und 110 Mitarbeiter in 13 Scrum Teams: Das sind die Eckdaten der Plattform für Reisendeninformation (RI-Plattform) der Deutschen Bahn. Dabei handelt es sich um ein Pilotprojekt mit Unterstützung aus der Cloud, das die Senior Projektmanager Axel Löhn, Heinrich Bernhard und Alexander Herrmann auf dem Transformation Day von Amazon Web Services vorstellten.

Cluster-Systeme für Big-Data

Das System soll alle Informationen der einzelnen Endkunden-Anzeigen wie zum Beispiel der DB-App oder Informationstafeln am Bahnsteig bündeln und synchronisieren, um einheitlich über Abweichungen des Fahrplans zu informieren. Ende 2015 starteten drei agile Teams die Entwicklung einer Plattform als Knotenpunkt.

Die Daten, die die RI-Plattform verarbeiten muss, fließen aus unterschiedlichen Informationskanälen zusammen.
Foto: Deutsche Bahn

Die Herausforderung: Eine große Menge an Daten in einem dynamischen System konsistent zu halten. Das Herzstück bilden zwei zentrale Cluster-Systeme für eine Big-Data-Umgebung, die auf Apache Kafka und Cassandra aufsetzt. Die Bahn nutzt das Open-Source-System Kubernetes für die Container-Orchestrierung.

Apache Kafka und Cassandra

Da jedes Event kundenrelevant sei, dürfe keines verloren werden, berichtete Löhn. Das System sollte ausfallsicher und trotzdem flexibel sein. Dafür orchestriere die Middleware Kafka die Microservices aus der Cloud. Um die erforderliche Rechenleistung zur Verfügung zu stellen, seien 100 virtuelle Server von AWS im Einsatz.

In der Datenbank Cassandra dagegen lägen zum Beispiel Fahrplandaten. Die Konfiguration wurde in enger Zusammenarbeit mit AWS optimiert, sodass diese auch in Zukunft gut skalierbar sei. Denn bisher operiere die Plattform nur mit Daten für den Fernverkehr. Der öffentliche Nahverkehr soll folgen.

Agile Teams im Home Office

Zu Projektbeginn sei die Umstellung auf agile Strukturen eine große Veränderung gewesen, so die Projektverantwortlichen. 90 Prozent der Projektgruppe bestünden aus externen Entwicklern aus verschiedenen Nationen, die wahlweise im Home Office arbeiten können. Empfehlen können die Projektmanager in diesem Zusammenhang den Leitsatz "You build it, you run it." So sei ein hohes Engagement für die Entwicklungen entstanden.

Gute Erfahrungen habe man auch mit einem Patenkonzept für die Teams gemacht. Zielführend sei der Gildengedanke gewesen, in der jede Gilde einen eigenen Auftrag hat, beispielsweise Optimierung oder Qualität.

Das System im Kundeneinsatz

Schritt für Schritt wird das System ausgerollt - zunächst in Plauen, mittlerweile in Pilotprojekten in Regensburg, Göttingen und Sachsen. Im ersten Jahr arbeitete das System zu 99,9 Prozent ausfallsfrei.

Perspektivisch kündigten die Senior Projektmanager an, sich mit dem Thema Selbstheilung auseinanderzusetzen. So soll die aktuelle Tag-und-Nacht-Rufbereitschaft minimiert werden. Dabei soll der Service Amazon Connect helfen. So will die Bahn auch die Kosten senken.