Oracle Senior IT

Unstrukturierte Daten

Der ungehobene Schatz

02.11.2009
Von 
Holger Eriksdotter ist freier Journalist in Hamburg.
Eine Flut an unstrukturierten Daten überrollt seit Jahren die Unternehmen. Der steigende Bedarf an Storage-Kapazitäten ist dabei angesichts sinkender Hardware-Preise nur ein Randaspekt. Vielmehr entgeht den Firmen wertvolles Wissen, das unerschlossen vor sich hinschlummert. Auch birgt die Masse der unstrukturierten Daten erhebliche rechtliche Risiken.

Dass die Datenmenge in den Unternehmen zunimmt, ist keine Überraschung: Experten gehen davon aus, dass sie sich etwa alle zwei bis drei Jahre verdoppelt. Eigentlich kein großes Problem - die Speicherpreise pro Gigabyte sinken seit Jahren. Es sind vor allem unstrukturierte Daten, die zum Anschwellen der Datenflut beitragen. Schätzungen gehen davon aus, dass heute nicht einmal ein Viertel aller Daten in strukturierter Form in den Datenbanken der Unternehmens-Applikationen abgelegt ist. Der große Rest ist "unstrukturiert" und verteilt sich auf E-Mail- und Messaging-Systeme, PDFs, Office-Daten, und immer häufiger auch Audio- und Video-Dateien. Der Versuch, dem wachsenden Datenvolumen allein mit dem Ausbau der Storage-Kapazität zu begegnen, ist allerdings zu kurz gedacht.

"Wahre Produktivitätssprünge können erst erreicht werden, wenn strukturierte und unstrukturierte Daten kombiniert werden", so IDC-Analyst Rüdiger Spies.
"Wahre Produktivitätssprünge können erst erreicht werden, wenn strukturierte und unstrukturierte Daten kombiniert werden", so IDC-Analyst Rüdiger Spies.
Foto: IDC

Das Problem: Obwohl diese Daten oft relevante Informationen enthalten, sind sie dem Zugriff von analytischen Applikationen weitgehend entzogen. Denn BI-Applikationen greifen in der Regel auf ein Data-Warehouse zu, das wiederum mit den (strukturierten) Daten der Unternehmens-Applikationen befüllt wird. "Die Data-Warehouse-Technologie kann für sich auch in Anspruch nehmen, dass aus den Unternehmensdaten wertvolle Informationen entstehen, die zu besseren Entscheidungen führen. Das gilt aber nur für strukturierte transaktionsorientierte Daten", schreibt IDC-Analyst Rüdiger Spies in seiner CIO-Kolumne.

Während BI-Lösungen heute als Basis von Geschäftsentscheidungen und für die Steuerung und Planung kaum mehr aus dem Unternehmensalltag wegzudenken sind, bleibt doch das Manko, dass unstrukturierte Daten - und damit wichtige Informationen - regelmäßig außen vor bleiben. "Wahre Produktivitätssprünge können erst erreicht werden, wenn strukturierte und unstrukturierte Daten kombiniert werden", resümiert Analyst Spies.