Data Scientists

Die Jäger wertvoller Daten

07.05.2015
Peter Ilg ist freier Journalist in Aalen.

Seit 2005 ist er bei der Allianz und hat acht Mitarbeiter im Team, darunter Informatiker, Mathematiker, Statistiker. Sie analysieren Kundendaten unter dreierlei Gesichtspunkten: Kunden werden segmentiert, um Zielgruppen oder Untergruppen zu erkennen, damit die passend angesprochen werden können. Der zielgruppenspezifischen Ansprache dient auch die Prognose von Kundenverhalten, die zu dem Ergebnis führt, welche Kunden welchen Bedarf haben. Und schließlich werden Kunden und deren Verhalten statistisch ausgewertet, um eine Erklärung dafür zu finden, warum die Entwicklung in die eine oder andere Richtung geht.

Mihael Ankerst, Allianz: "Unsere Mitarbeiter brauchen methodisches Wissen, um geeignete statistische Verfahren zur Datenanalyse einzusetzen.
Mihael Ankerst, Allianz: "Unsere Mitarbeiter brauchen methodisches Wissen, um geeignete statistische Verfahren zur Datenanalyse einzusetzen.
Foto: McIek - Shutterstock.com

Daten, die dafür zugrunde gelegt werden, sind die 20 Millionen Privatkunden der Allianz Deutschland und externe Quellen. Analysiert wird mithilfe von Software anhand vorgegebener Kriterien. Ankersts Mitarbeiter müssen verstehen, was eine Versicherung ist und wie sie funktioniert. Sie brauchen methodisches Wissen, um geeignete statistische Verfahren zur Datenanalyse einzusetzen und sie müssen verstehen, wie die Versicherungsrealität in Daten abgebildet ist.

Software und Techniken, die zur Datenanalyse genutzt werden sind SQL von OracleOracle, In-Memory-Technologien und die Programmiersprachen SAS und R. "Bei den persönlichen Skills steht Kommunikation über allem, weil vieles in unserem Job über den Austausch mit Kollegen geschieht." Alles zu Oracle auf CIO.de

Auch in anderen Abteilungen bei der Allianz arbeiten Datenanalysten, beispielsweise bei den Aktuaren zur Kalkulation von Tarifen und in der IT. "Grob geschätzt kommen etwa 80 zusammen", sagt Ankerst. Und der Trend sei eindeutig steigend, weil das Kerngeschäft der Versicherung auf Daten beruht und die Digitalisierung unserer Gesellschaft stark zunimmt.

Big Data

Die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, wird 2020 bei etwa 40 Zettabytes liegen. Das ist eine Zahl mit 21 Nullen. Innerhalb von zehn Jahren soll die Datenmenge dann um das 50-fache gestiegen sein, schätzen Marktbeobachter von IDC und des Speichersystem-Herstellers EMC. Und es werden immer mehr: Alle zwei Jahre verdoppelt sich das Datenvolumen. Seit 2002 werden Daten häufiger digital als analog gespeichert.

Seitdem hat auch die Vielfalt der Datentypen zugenommen. Dazu gehören Video, Audiodateien, Texte in E-Mails, Nachrichten in Social Media, Suchanfragen bei GoogleGoogle, Anzeigen auf Plattformen für den Verkauf gebrauchter Autos oder Einträge in Foren zu Gesundheitsfragen. Nur drei Prozent der Daten lassen sich über ein Schlagwort suchen. Um rasch fündig zu werden, braucht es eine leistungsfähige Technik, unter anderem In-Memory-Computer. Diese Rechner haben gigantisch große Arbeitsspeicher. Auf der Suche nach wichtigen Informationen durchforsten sie nicht mehr mühsam Festplatten, denn die Daten liegen abrufbereit im Arbeitsspeicher. Alles zu Google auf CIO.de

Zur Startseite