Die Big-Data-Bauer

Was Daten-Profis können müssen

18.03.2014 von Bettina Dobe
Big-Data-Experten sind begehrt. Aber die Spezialisten sind rar - und Ausbildungswege gibt es noch zu wenige.

Big Data ist derzeit das am stärksten gehypte Thema der Branche. Die Möglichkeit, in Sekundenschnelle Informationen etwa über das Kaufverhalten von Kunden auszuwerten, lockt Unternehmen an. Bis 2016 entstehen durch Big Data 4,4 Millionen neue Jobs allein in der IT, sagen die Marktforschungsexperten von Gartner. Die Nachfrage nach Spezialisten, die mit den riesigen Datenmengen umgehen können, steigt. "Das ist schon ein Trend in der Branche", sagt Professor Andreas Polze vom Hasso-Plattner-Institut (HPI) an der Uni Potsdam.

Grundsätzlich gebe es für das Berufsbild des Big-Data-Experten zwei Ansätze: zum Beispiel den Wirtschaftsinformatiker, der Informationen auswertet. "Dabei spielt Realtime Analytics eine sehr große Rolle", sagt Polze. "Alle großen Hersteller, wie IBM, SAP und HP, haben dazu natürlich schon Analysemöglichkeiten", sagt er. "In Echtzeit Datenströme analysieren und dementsprechend auf die Nutzer reagieren zu können - das basiert auf großen Daten", gibt Polze ein Beispiel von Wirtschafts-orientierten Big Data Anwendungen.

Nur wenige Spezialisten

Doch die Spezialisten sind rar und eine richtige Ausbildung mit Zertifikat gibt es für sie nicht. Vielmehr erwerben die Experten, zu denen auch Berufsbilder wie der Data Scientist, Data Analyst und der Information Broker gehören, ihre Qualifikation im Job selbst. Dementsprechend unterschiedlich qualifiziert sind die Spezialisten und so haben es Unternehmen mitunter schwer, die Erfahrungen zu vergleichen.

Eine vereinheitlichte Ausbildung wäre sinnvoll, aber an Universitäten kommt der Hype um Big Data nur langsam an - das Thema ist noch zu frisch, um sich in Lehrplänen wieder zu finden: "Im Bachelor kommt das bei uns noch nicht so wirklich durch", meint Cindy Fähnrich, Masterstudentin am HPI. Aufbauend auf ihrem Bachelor in IT-Systems Engineering studierte sie noch einen entsprechenden Master. "Insgesamt hat mich das Studium schon auf den Beruf des Big Data Experten vorbereitet", meint sie - auch wenn sie ihn so konkret nicht einschlagen will. "Man bekommt schon mit, dass dieses Berufsbild groß im Kommen ist", sagt Fähnrich. "Auch wenn das sicherlich ein bisschen überhypt ist."

Das muss der Spezialist können

Die Anforderungen an die Datenschürfer sind sehr hoch. "Er muss auf jeden Fall die Basistechnologien verstehen, also Betriebssysteme und Datenbanksysteme", sagt Polze vom HPI. Ohne programmieren zu können, gehe nichts. Fundierte Mathematikkenntnisse seien ebenfalls eine Voraussetzung, genau wie die Fähigkeit zur Modellierung. "Und das alles muss dann auf ein höheres Abstraktionsniveau gehoben werden", sagt Polze.

Neben den fachlichen Fähigkeiten muss ein Big Data Experte allerdings noch mehr mitbringen: wichtige Soft Skills etwa. Dafür können die Universitäten sorgen: "Wir lernen in Kursen, vernünftig zu kommunizieren und Soft Skills richtig einzusetzen", erzählt Fähnrich. "Auch Präsentationstechniken werden vermittelt. Die Leute sollen verstehen, wie man sein Anliegen richtig vermittelt und wie man gut im Team zusammenarbeitet", erzählt sie. Für Big Data Experten unschätzbar wichtig, schließlich arbeiten sie zwischen vielen Abteilungen und sitzen häufig zwischen den Stühlen. Wenn sie nicht klar vermitteln können, was ihre eigentliche Aufgabe ist, haben sie schon verloren.

Dazu müssen sie das fachübergreifende Denken beherrschen. "Wir arbeiten an Projekten in interdisziplinären Teams. Da hilft es schon enorm, wenn man sich in andere Aufgaben hineindenken kann", sagt Fähnrich. "Man muss gerade als Informatiker offen sein gegenüber anderen - auch wenn das manchen sicher schwerfällt", glaubt sie. "Wir Informatiker arbeiten sehr lösungsorientiert, andere Berufe denken aber ganz anders. Damit umzugehen, das muss man erst mal lernen", erzählt sie.

Team-Zusammensetzung
Big Data-Initiativen brauchen das richtige Team. Die Berater von McKinsey haben fünf Rollen identifiziert, die CIOs in einer solchen Truppe besetzen müssen.
Spezialist für Daten-Qualität
Zunächst einmal setzt Big Data voraus, dass sich jemand um Qualität und Hygiene der Daten kümmert. Die Informationen müssen sauber und akkurat sein. Das beginnt bei scheinbar Selbstverständlichem: Was ist ein Jahr - 365 Kalendertage, 260 Arbeitstage oder 8765 Stunden? Hier braucht es eine einheitliche Definition.
Data Explorer
Welche Informationen aus der Flut an Daten sind nützlich - das herauszufinden, ist Aufgabe des Data Explorers. Eine Herausforderung nicht nur wegen der Menge an Daten, sondern auch wegen des Umstands, dass viele Daten ursprünglich nie als Analyse-relevant galten. Sie wurden zwar erfasst, man fand sie aber nicht wichtig - der Data Explorer muss diese Informationen aufspüren und zusammentragen.
Architekt
Was der Data Explorer eingesammelt hat, muss der Architekt so aufbereiten, dass es Analyse-tauglich ist. Er orientiert sich dabei an den Lösungen, die Business-Manager brauchen werden. Der Eine muss sich jede Minute auf den neuesten Stand bringen können, der andere nur jede Stunde.
Data Scientist
Aus den vorbereiteten Daten entwickelt der Scientist anspruchsvolle Analyse-Modelle. Ein Beispiel aus der Handelsbranche: Die Analyse-Modelle helfen dem Unternehmen, Zielgruppen genauer zu beschreiben und die Preise besser gestalten zu können.
Kampagnen-Macher
Um beim Handelsbeispiel zu bleiben: Der Kampagnen-Spezialist im Team setzt die Analyse-Ergebnisse in Resultate um. Er weiß, welche Kundengruppen über welche Kanäle angesprochen werden wollen, wie oft die Kunden kontaktiert werden sollten und anderes. McKinsey sieht keinen reinen Marketing-Spezialisten in dieser Funktion, sondern definitiv jemanden, der die technische Seite verantwortet.

Eine Eigenschaft ist die für Big Data Experten unerlässlich: "Meiner Meinung nach sollte ein Big Data Experte die Struktur von Daten verstehen, und wie man diese aufbereitet", sagt Polze. "Ohne Kenntnisse der unterliegenden Software Architekturen ist das schlecht möglich." Daraus ergibt sich das zweite große Berufsbild des Big Data Experten, das bislang von Unternehmen noch weitestgehend ignoriert wurde: die Software-Architekten, die Systeme für Big Data bauen. "Es erfordert ein gerüttelt Maß an IT-Engineering, um ein System erst einmal so weit zu bekommen, dass man darin auch Big Data vernünftig anwenden kann", sagt Polze. Erst dann könne man sich wieder dem Business zuwenden.

Effizienter auswerten

Wenn es noch keine feste Ausbildung zum Big Data Experten geben kann - Grundlagen in Software-Architektur vermitteln Universitäten. "Ich habe zum Beispiel gelernt, wie man große Software-Systeme vernünftig baut", sagt Fähnrich. Spezialisiert hat sie sich auf Big Data Architektur. "Ich bin spezialisiert darauf, große Datenmengen auszuwerten und darauf, wie man Verknüpfungen zwischen den Daten erstellen kann", sagt Fähnrich. Im Master wertete sie Genom-Daten aus, ein Bereich, in dem Big Data eine wichtige Rolle spielt. "Da können schon mal ein Terrabyte an Daten anfallen", sagt Fähnrich. 3,2 Milliarden Basenpaare sollen ausgewertet werden - und zwar endlich automatisch und nicht mehr teilweise händisch, wie früher. "In meiner Arbeit ist es essenziell, dass man die großen Datenmengen effizient auswerten kann", sagt Fähnrich.

Polzes Institut befasst sich hauptsächlich mit System-Architektur. Schließlich sind für die Analyse von großen Datenmengen Geschwindigkeitssteigerungen von Berechnungen essenziell. Für große Firmen ein interessanter Aspekt: Mit geschickter Architektur lässt sich zum Beispiel die Rechenleistung von mehreren tausend Computern im Parallel Processing verbessern. Das kann einen entscheidenden Effizienzgewinn mit sich bringen. Ein ebenfalls wichtiger Aspekt der Forschung im Big Data Bereich betrifft die Verwaltung großer Datenmengen. "Natürlich ist die Duplikatserkennung ein wichtiges Thema. Data Cleaning kommt bei uns an", sagt Polze. Welches Unternehmen träumt nicht von entschlackten Datenbanken?

Trotz der Forschung im Software-Architektur-Bereich: "Das Berufsbild des Big Data Experten würde ich eher bei Anwendungen sehen", meint Polze. "Also bei der Analyse von Geschäftsprozessen. Dort findet die wahre Revolution statt." Gerade in der Spiele-Industrie, wo online Multi-User-Spiele stattfänden, werde das Potenzial der Verarbeitung großer Datenmengen schon realisiert, meint Polze. Eine Evolution dagegen sei der Big Data Experte im Sinne der Software Architektur - er verbessere die Systeme und könne große Strukturen errichten. Aber noch sei nicht alles in der Entwicklung abgeschlossen, mahnt er. "Was die Sicherheit von verteilten Systemen angeht, oder beim Betreuen vieler Systeminstanzen - da ist noch viel Forschung zu betreiben."

Der nächste große Sprung

Die große Entwicklung stehe erst noch bevor, sagt der Professor voraus: "Genau wie beim Thema Cloud Computing hat auch Big Data als Business-Thema gestartet. Endlich sind wir an dem Punkt, wo die Systeme so stabil sind, dass die ursprüngliche Vision der Businesswelt langsam wahr werden kann." Ohne die Architekten der großen Systeme können die anderen Big Data Experten nicht vernünftig arbeiten. Es ist alles eine Frage des Handwerks.