Huge Data

Big Data war gestern

Harald Weiss ist Fachjournalist in New York und Mitglied bei New York Reporters.

Datenflut durch Wearables

Bei den Wearables zeichnen sich neue immense Datenberge ab. Beispielsweise werden GPS-Geräte und Sensoren in die Trikots der Fußballspieler eingenäht. Darüber lassen sich dann die Bewegungen, die Beschleunigung und die körperliche Belastung sekundengenau übers Internet abrufen. In der allgemeinen Gesundheitsvorsorge bekommt die kontinuierliche Fernüberwachung ebenfalls eine immer größere Bedeutung - alles Huge-Data-Anwendungen also.

Mehr Daten bedeutet weniger Mathematik

Der zunehmende Einsatz von Predictive Maintenance basiert zum großen Teil auf der Extrapolation von Ereignisabläufen aus der Vergangenheit. Das heißt, je mehr Daten zur Verfügung stehen, umso mehr und umso besser sind die Prognosen. Viele Datenwissenschaftler vertreten inzwischen sogar die These, dass die Komplexität der Datenmodelle abnimmt, wenn mehr Daten zur Verfügung stehen. Hierbei berufen sie sich meist auf die Arbeit des Computer-Wissenschaftlers Peter Norvig, der in seiner Veröffentlichung "The Unreasonable Effectivness of Data" praktisch zu dem Schluss kommt: "Je mehr Daten - umso weniger Mathematik".

Zu viel Daten-Schrott

Doch nicht alles, was gespeichert wird, muss aufgehoben werden, ist meistens auch nicht wichtig oder zumindest noch hilfreich. "Der größte Teil aller gespeicherten Daten ist Schrott und vergeudet nur die Zeit von teuer bezahlten Daten-Wissenschaftlern, die im Daten-Heustober herumstochern", kritisiert Jake Frazier, Analyst bei FTI Consulting.

Müssen wirklich alle Daten gespeichert werden - oder können sie etwa nach einer problemlosen Autofahrt gelöscht werden?
Müssen wirklich alle Daten gespeichert werden - oder können sie etwa nach einer problemlosen Autofahrt gelöscht werden?
Foto: Syda Productions / shutterstock.com

Um das Datenwachstum in Zukunft etwas abzuschwächen, werden bereits verschiedene Daten-Management- und gesetzliche Regeln diskutiert. Bill Franks, Chief Analytics Officer bei Teradata, meint, dass in Zukunft alle produzierten Daten bereits einen "Verfallsdatums-Stempel" bekommen müssen. Als Beispiel verweist er auf die Datenmenge die in einem Auto beim automatischen Einparken anfallen. "Sobald das Auto sicher in der Parklücke steht, können die Daten gelöscht werden. Nur im Fall einer Schramme müssen sie noch für die Ursachen-Analyse aufgehoben werden", begründet er seine Meinung.

Niemals etwas löschen

Damit weist Franks bereits auf das größte Problem der Datenspeicherung hin: Rechtsauflagen, beziehungsweise die Angst vor Strafen wegen gelöschter Daten. "CIOs haben eine Datenspeicher-Mentalität, die sich am besten mit ‚create once - delete never‘ beschreiben lässt. Hierbei bekommen sie Unterstützung von den Fachbereichen, die auch alle meinen ‚je mehr - je besser‘", meint Frazier.

Rechtsunterschiede

Ein weiteres Problem bei der strikten Datenlöschung sind die unterschiedlichen rechtlichen Vorgaben beim Cloud-Computing. Jedes Land hat andere Vorschriften über die Datenbehandlung. In den USA gibt es sogar Unterschiede von Bundesstaat zu Bundesstaat. Diesen Punkt verschweigen die Cloud-Provider gerne, wenn sie vom schnellen Verschieben der Daten von einem globalen Rechenzentrum ins andere reden. Doch selbst wenn die jeweils lokalen Gesetze beachtet werden, kann das eventuell nicht ausreichen. Das wird besonders deutlich an dem Prozess, den Microsoft mit den US-Ermittlungsbehörden ausficht. Das Justizministerium will nämlich an Daten ran, die Microsoft in Irland speichert - und Microsoft verweigert die Herausgabe und beruft sich dabei auf irisches und europäisches Recht. Und so wie es derzeit aussieht, wird der Prozess wohl vor dem Supreme Court landen.

Zur Startseite