Microsofts Plattform für Business Intelligence

Die BI-Neuerungen beim SQL Server 2008 R2

17.03.2010 von Klaus Manhart
Im Bereich Business Intelligence bringt der SQL Server R2 eine ganze Reihe von Neuerungen. Große Datenmengen sollen sich nun leichter und effizienter verarbeiten lassen. Weniger versierten Anwendern will Microsoft damit die Erstellung von professionellen BI-Lösungen deutlich einfacher machen.
BI-Dreigestirn: Der SQL Server 2008 R2, Office 2010 und Sharepoint 2010 bilden künftig Microsofts BI-Plattform. (Quelle: Microsoft)

Mit dem SQL Server 2008 R2 will Microsoft den Markt für BI-Lösungen ab Anfang Mai 2010 gehörig durcheinander wirbeln. Schon die Vorgängerversionen waren mit Business Intelligence-Komponenten ausgestattet. Die Enterprise-Ausgabe von Release R2 bringt nun aber noch einmal deutliche Erweiterungen.

So stellt sich R2 als durchgängige, integrierte BI-Plattform auf, die Data Warehousing, OLAP, Data Mining, ETL und das Reporting beinhaltet. Die BI-relevanten Konzepte und Tools werden damit im SQL Server vereint - von der Integration von Daten aus unterschiedlichen Quellen über Datenanalysen bis zur Bereitstellung und Verteilung von Reports.

Gleichzeitig soll der SQL Server aber nicht nur eine Plattform für hochgradig spezialisierte BI-Experten sein. Vielmehr will Microsoft mit Release R2 Business Intelligence für alle in die Unternehmen bringen. Die neue Version ist mit intuitiven Tools ausgestattet, die die Einsatzmöglichkeiten von BI im ganzen Unternehmen erweitern. Komplexe BI-Analysen sollen über neue SQL-Server-Technologien wie die Self Services und Excel als Client ganz normalen Unternehmens-Anwendern möglich werden.

Entsprechend positioniert Microsoft den SQL-Server im BI-Umfeld nicht als isoliertes BI-Tool, sondern sieht ihn als zentralen Teil einer umfassenden Business-Intelligence Plattform. Diese BI-Plattform enthält neben dem SQL Server 2008 R2 das Mitte 2010 erscheinende Office 2010 sowie SharePoint 2010.

Während Office 2010 die neuen Client-Features für Self Service BI mitbringt - beispielsweise Adhoc-Analysen oder Reporting - wartet der SQL Server 2008 R2 mit der Server-Software dafür auf und SharePoint 2010 fungiert als Enterprise 2.0 Portal, auf dem dies alles dem Nutzer präsentiert wird.

Integration Services

Datenintegration, Datenanalyse und das Reporting bilden die Grundpfeiler von Business Intelligence in Unternehmen. Beim SQL Server 2008 werden diese BI-Prozesse im Rahmen von Services behandelt - als Integration Services, Analysis Services und Reporting Services. Diese drei Dienste bilden das BI-Grundkorsett des neuen SQL Servers.

Für den ETL-Prozess - also die Datenextraktion aus verschiedenen Datenquellen und deren Bereinigung und Transformation - stellt der SQL Server mit den Integration Services 2008 (SSIS) eine Plattform zur Verfügung. Ein breites Repertoire von vorgefertigten Komponenten sorgt für eine adäquate Datenmanipulation und eine professionelle Beladung von Data Warehouses.

Daten-Integration: Die Integration Services bilden den Kern der BI-Funktionalitäten des SQL Servers 2008. (Quelle: Microsoft)

Dazu gehört beispielsweise das Anpassen von Datentypen und Datumsformaten oder das Aggregieren der bereitgestellten Daten. Außerdem werden umfangreiche Möglichkeiten für die Normalisierung und für die Plausibilitätsprüfungen von Daten angeboten. Grafische Tools und Assistenten unterstützen dabei. Der SSIS-Designer hilft beispielsweise, Schritt für Schritt ein einfaches ETL-Paket einschließlich Schleifen, Konfigurationen, Fehlerflusslogik und Protokollierung zu erstellen. So muss kein einziger SQL-Befehl eingegeben werden, um Daten aus einer Datenbanktabelle zu lesen.

Die Transformationsprozesse lassen sich parallel abarbeiten, so dass auch komplexere Prozesse relativ zügig ablaufen. Als Schnittstellen zur Anbindung externer Daten stehen die Formate Text, XML und XLS zur Verfügung, außerdem lässt sich mit Hilfe von OLE DB und ODBC auf alle Datenquellen zugreifen, die diese Schnittstellen unterstützen. Die Integration Services sind vollständig in die Microsoft Entwicklungsumgebung eingebettet. Die Entwicklung selbst wird im Business Intelligence Development Studio (BIDS) durchgeführt.

Paralleles Data Warehouseing

Umgangreiche Änderungen in der Version R2 des SQL Servers 2008 gibt es im Bereich Data Warehousing. Hierfür bietet Microsoft neben der R2 Enterprise Basis-Edition zwei neue Premium-Editionen an. Diese orientieren sich an den Anforderungen sehr großer Rechenzentren und Data Warehouses.

Die Premium-Ausgabe „R2 Datacenter“ baut auf der Enterprise-Edition auf, wurde aber für hochperformante Datenplattformen und hohe Skalierbarkeit von großen Anwendungs-Workloads optimiert. So unterstützt die Datacenter-Edition beispielweise Virtualisierung, komplexe Ereignisverwaltung, bis zu 256 logische Prozessoren und so viel Arbeitsspeicher, wie unter dem Betriebssystem möglich ist.

SQL Server 2008 R2 Editionen: BI-Funktionalitäten stehen ab der Enterprise-Edition zur Verfügung, „Datacenter“ und insbesondere die "Parallel Data Warehouse Edition" sind für höhere Anforderungen gedacht. (Quelle: Microsoft)

Der eigentliche Clou aber ist die zweite Premium-Edition, die „Parallel Data Warehouse Edition“, entwickelt im Projekt Madison. Diese Variante des SQL Servers, die als Appliance in Verbindung mit Server Hardware erhältlich sein soll, ist auf riesige, hoch skalierbare Data Warehouses bis zu mehreren Petabyte ausgelegt. Die Technologie hierfür - die Massive Parallel Processing Architecture (MPP) - wurde von der Firma DATAllegro entwickelt. Das Unternehmen wurde von Microsoft aufgekauft und deren Technologie nun in die R2 integriert.

Das Konzept ist einfach, aber bereits aus anderen IT-Bereichen bekannt: Nicht ein einziger Super-Server verrichtet die Arbeit, die ganz Datenflut zu bewältigen, sondern sie wird auf mehrere Rechner aufgeteilt. Anstelle eines einzigen Data Warehouse-Servers schließt man mehrere Standard-Server zu einem Cluster zusammen. Gehen Abfragen von Clients ein, werden diese parallel von den einzelnen Knoten bearbeitet. Am Ende wird ein konsolidiertes Ergebnis zum Client zurückgeschickt.

Analysis Services

Stehen die Daten aufbereitet im Data Warehouse bereit, können sie weiter verarbeitet und analysiert werden. Eine einheitliche und integrierte Ansicht der gesamten Business-Daten stellen im SQL Server 2008 die Analysis Services zur Verfügung. Die Analysis Services sind die Basis für alle traditionellen Berichte, OLAP-Analysen, KPI-Scorecards (Key Performance Indicator) und Data Mining.

Mit der BI-Schlüsseltechnologie OLAP lassen sich Daten, dargestellt als Cube (Würfel), aus verschiedenen Blickwinkeln analysieren. Die Analysis Services stellen dafür alle OLAP-Konzepte wie Hierachien, Dimensionen, Drill Downs und Drill ups bereit. Auch hier gibt der SQL Server 2008 wieder umfangreiche Unterstützung.

So ist es angesichts der vielen neuen Modellierungsmöglichkeiten wie m:n-Dimensionen oder referenzierte Dimensionen sehr hilfreich, dass jetzt beim Modellieren von Cubes Design-Ratschläge gegeben werden. 40 Best Practices sind in das Business Intelligence Development Studio integriert und geben in dezenter Form Hinweise, wenn dagegen verstoßen wird.

Data Mining Addins für Excel erleichtern die Datenanalysen. (Quelle: Microsoft)

Durch die Bildung von Aggregationen kann die Performance der Abfragen stark gesteigert werden. Dies erfolgt durch Berechnung von Zwischensummen für wichtige Dimensions-Attribute. Damit die Ergebnisse bereits zum Abfragezeitpunkt vorliegen, werden die Aggregate bereits im Voraus berechnet und gespeichert. Mit dem grafischen Aggregations-Designer im Business Intelligence Development Studio ist es zudem jetzt möglich, die Aggregationen sehr detailliert zu optimieren.

Der zweite Analyseschwerpunkt, Data Mining, war in früheren SQL Server Versionen ziemlich unterentwickelt. Die Analysis Services 2008 bieten nun eine sehr umfangreiche Palette von Data-Mining-Technologien - unter anderem Entscheidungsbäume, Clustering, Assoziationsanalyse, Zeitreihenanalyse, Neuronale Netzwerke und Lineare Regression. Zudem lassen sich weitere selbst entwickelte Algorithmen oder solche von Drittanbietern implementieren, um so den individuellen Ansprüchen an das Data Mining gerecht zu werden.

Powerpivot

Als größte und spannendste Neuerung in der aktuellen Version R2 der SQL Servers 2008 gilt Self Service BI mit Powerpivot, das unter dem Codenamen „Project Gemini“ bekannt ist. Microsoft will mit diesem Analysis Service Tool die „Underground-BI“ ansprechen und professionalisieren, die sich in vielen Unternehmen auf Basis von Office und Excel gebildet hat. Ganz „normale“ Unternehmens-Nutzer sollen damit BI-Anwendungen erstellen können, ohne auf BI- und Datenbankspezialisten angewiesen zu sein.

Powerpivot: Große Datenmengen lassen sich mit Excel-2010-Addin Powerpivot leicht analysieren und darstellen. (Quelle: Microsoft)

Powerpivot versetzt Enduser in Form von Excel Add-ins und in Verbindung mit dem SQL Server in die Lage, selbstständig große Datenmengen aus dem Data Warehouse schnell zu analysieren und Reports zu generieren. Über ein Import Framework können Daten aus unterschiedlichen internen und externen Quellen wie SQL-Datenbanken, Access oder Excel einfach eingelesen werden.

Die importierten Daten lassen sich mit Pivot-Tabellen und -Charts auswerten und visualisieren. Nach Angaben von Microsoft können mit der 64-Bit-Version von Excel mehrere 100 Millionen Datensätze analysiert werden. Neue Slider-Controls versuchen unbedarften Nutzern, den Umgang mit der Pivot-Technik zu erleichtern. Die Controls können direkt in die Sheets eingebettet werden. Die analysierten Daten lassen sich in Excel Sheets speichern und in regelmäßigen Intervallen aktualisieren.

Integration in Sharepoint

Eine Powerpivot-Gallerie, in der man durch alle verfügbaren Auswertungen scrollen kann, erleichtert Endusern die Auswahl des passenden Analysetools. Die verfügbaren Powerpivot-Tabellen können serverseitig verarbeitet und mit Excel-Services serverseitig gerendert werden.

Die mit Excel generierten Powerpivot-Analysen und -Berichte können Sharepoint-Nutzer direkt in Sharepoint Document Libraries integrieren und sie so anderen Mitarbeitern zur Verfügung stellen. In Sharepoint 2010 gespeicherte Powerpivot-Applikationen lassen sich via Schedule Service immer aktuell halten. Excel 2010 auf dem lokalen Arbeitsplatz ist damit nicht zwingend erforderlich.

Data Analysis Expression Language: DAX erweitert die Analysemöglichkeiten und ermöglicht komplexere Auswertungen. (Quelle: Microsoft)

Damit das funktioniert enthält Powerpivot eine Reihe von Client- und Serverkomponenten. Den zentralen Teil bildet die SQL Server Analysis Services-Komponente, die zusätzliche Module für Excel 2010 und Sharepoint 2010 anbietet.

Für nicht zusammenklickbare, komplexere Analysen soll die Data Analysis Expression Language (DAX) zum Einsatz kommen. DAX lehnt sich an die Formelsyntax von Excel an und ermöglicht weitergehende Auswertungen und Analysen für den typischen Excel-Nutzer. Beispielsweise kann mittels DAX ein neues Analyseverfahren clientseitig in Excel hinzugefügt werden, wenn es auf dem Server nicht vorhanden ist, aber für eine spezielle Auswertung benötigt wird. In etwa entspricht DAX den Multidimensional Expressions des SQL Servers, ist aber infolge der Excel-Syntax deutlich einfacher einzusetzen.

Reporting Services

Der dritte Pfeiler von SQL Server 2008, die Reporting Services, haben eine deutliche Erweiterung im Vergleich zu den Vorgängerversionen erfahren. Sie stellen eine Reihe von Tools zur Verfügung, mit denen sich Berichte erstellen, verwalten und liefern lassen sowie APIs, mit denen Entwickler die Daten- und Berichtsverarbeitung in benutzerdefinierte Anwendungen integrieren und erweitern können.

Die größten Änderungen des Reporting Services 2008 im Vergleich zu dessen Vorgängern waren die Einführung neuer Diagramme, Gauges und der Tablix - einer Kombination aus Tabelle und Matrix. Diese ermöglicht es, anspruchsvolle und repräsentative Grafiken von Kennzahlen oder KPIs darzustellen und zu visualisieren.

Mit den Reporting Services lassen sich Berichte leicht erstellen, unter R2 auch mit Landkarten und Geodaten. (Quelle: Microsoft)

Alle Rendering-Engines wurden überarbeitet, ein Rendering im Word-Format ist nunmehr machbar. Endbenutzer erhalten die Möglichkeit, mit dem Report Designer anspruchsvolle Berichte ohne Verwendung des Business Intelligence Development Studios zu erstellen. Für die Bereitstellung von Berichten über das Internet ist kein dedizierter Webserver mehr erforderlich.

Interessanteste Neuerung bei den Reporting Services im Release R2 ist der Report Builder 3.0. Er verfügt jetzt über einen neuen Servermodus, der beim Rendern von Berichten ein Caching durchführt. Anschließende Layout-Änderungen werden damit beschleunigt, da die Daten direkt aus dem Cache geholt werden. Für die Berichtsgestaltung sind neue Controls verfügbar. So erlauben die Reporting Services nun mit Map Control die Darstellung von Landkarten und Geodaten, die in einer SQL-Datenbank gespeichert sind. Mit den Reporting Services generierte Berichte lassen sich auch in Powerpivot-Anwendungen und andere Applikationen integrieren, wenn sie im Atom-XML-Format erstellt werden.

Fazit

Der SQL Server 2008 Release R2 bietet eine ganze Reihe neuer BI-Technologien. Die wichtigste Innovation ist Powerpivot, mit der BI näher an den Enduser gebracht werden soll. Damit lassen sich über eine Add-in direkt in Excel 2010 große Datenmengen analysieren. Die Powerpivot Excel Sheets kann man dann in einer Sharepoint-Dokumentbibliothek veröffentlichen.

Die neuen BI-Komponenten stehen in der Enterprise-Version des SQL-Servers 2008 R2 zur Verfügung. Für ganz große Datenmengen im Petabyte-Bereich bietet Microsoft eine hochskalierbare, parallel arbeitende Data Warehouse SQL-Lösung an, die als Appliance vermarktet werden soll.

Weiterführende Informationen zu den BI-Features im SQL Server 2008 R2 finden Sie im SQL Server Techcenter und in der Online-Dokumentation. Demos von Powerpivot gibt es als Teil 1 und Teil 2 bei Youtube. (TecChannel)