Schwächen bei der Datenintegration

Trends bei Lösungen für Data Warehousing

27.04.2009 von Nicolas Zeitler
Beim Metadaten-Management unterscheiden sich die Lösungen großer Anbieter für Datenintegration deutlich. Das zeigen Tests. Fortschritte machen Hersteller beim Management von Warehouse-Plattformen.

Die Produkte der untersuchten Anbieter für die Datenintegration entwickeln sich immer stärker zu Plattformen. "Die Plattformen integrieren weitere, über reines ETL hinausgehende Funktionen, wie zum Beispiel Funktionen für die Datenqualität oder Methoden für den near-time Zugriff auf Daten", sagte Timm Grosser, Produktmanager bei BARC und Mitautor der Studie, gegenüber CIO.de. Tatsächlich zeigten sich aber bei der Integration noch immer Schwächen, die oft erst auf den zweiten Blick sichtbar würden.

Fortschritte festgestellt haben die BARC-Tester bei den Funktionen für die Datenqualität. Außer Adressdaten gelinge es den Programmen zunehmend auch, Produktdaten mit Standard-Funktionen zu bereinigen. Bei der Qualitätssicherung für Adressdaten können zunehmend auch Personen länderübergreifend bereinigt werden.

Die IT-Analysten vom Würzburger BARC (Business Application Research Center) haben ihre Software-Evaluation von Lösungen für Data Warehousing und Datenintegration aktualisiert und erweitert. Neu verfügbar sind Produktbeschreibungen und Bewertungen im Bereich Datenintegration für die Lösungen von IBM und Informatica, bei den Data-Warehouse-Plattformen Produkte von IBM, Oracle, SAS Institute GmbH und Teradata.

Grundlage der Bewertungen ist ein Katalog mit mehr als 200 Kriterien, wie Grosser erklärt. Beurteilt wurden beispielsweise die Fähigkeiten zur Integration, die Skalierbarkeit und Konnektivität einer Lösung oder die Entwicklungseffizienz. Die BARC-Experten testen die Produkte zu diesem Zweck in ihrem Testlabor. Dabei fließen typische Szenarien aus der Praxis ein, wie Grosser berichtet.

Die größten Unterschiede zwischen den Anbietern haben die BARC-Experten beim Metadaten-Management festgestellt. Als Negativ-Beispiel für integrierte Systemlandschaften nennt Grosser eine Integrations-Lösung, die noch nicht über ein zentralisiertes Metadaten-Management verfügt. "Die Metadaten der einzelnen Datenflüsse werden von den Softwarewerkzeugen in separate Dateien geschrieben, die nicht integriert sind. Übergreifende Auswertungen im Sinne von Verwendungsnachweisen sind auf diese Weise nicht ohne weiteres umsetzbar", erklärt er.

Strenge Vorgaben im Bankensektor

Auf der anderen Seite gebe es Lösungen mit sehr gutem Metadaten-Management. Positiv beurteilten die Tester zum Beispiel Repositories, die der Anwender individuell ergänzen kann und die zudem umfangreiche Berichtsfunktionen enthalten. Gerade im Umfeld der Business Intelligence können Datenintegrationsplattformen die Möglichkeit bieten, Metadaten end-to-end zu integrieren.

Grundsätzlich sei das Metadaten-Management aber ein Feld, das noch genug Spielraum für Verbesserungen zulässt, gerade im Bereich applikationsübergreifender Metadatenintgration, meint Timm Grosser. Es gehe dabei darum, dass die heterogenen Applikationslandschaften in Firmen eine "gemeinsame Sprache" sprächen und es einen single-point-of truth für Metadaten gäbe. Wichtig sei dabei auch eine lückenlose Aufzeichnung von Veränderungen. Grosser: "Gerade im Bankensektor muss jeder Systemzustand dokumentiert sein."

Performance kritisch hinterfragen

Bei den Warehouse-Plattformen hebt Timm Grosser vor allem das Management hervor. Darin seien die verfügbaren Lösungen in letzter Zeit besser geworden. "Intelligenter", wie der Autor der BARC-Evluation formuliert.

Mit Vorsicht genießen sollten Anwender allerdings die Behauptungen der Hersteller zur Performance. Allein das Vorhandensein bestimmter Schnittstellen sage über Qualität und Performance noch nicht viel aus. "Gerade wenn man eine Best-of-Breed-Strategie fährt, arbeiten nicht alle Komponenten gleich gut miteinander", erklärt Grosser.