Grundlagenserie Business Intelligence

BI-Datenmanagement (Teil 2): Das Data Warehouse

Das dezentrale DWH – Data Marts

Die bereits mehrfache erwähnten Data Marts können als dezentrale DWHs aufgefasst werden, also in kleinere Einheiten zerlegte DWHs. Sie sind gekennzeichnet durch einen engeren Fokus, eine starke Anwendungsorientiertheit und ein deutlich geringeres Datenvolumen im Vergleich zu Core DWHs. Vor allem sind Data Marts auf spezielle Nutzerkreise ausgerichtet.

Data Marts werden in der Regel aus dem Core DWH befüllt.
Data Marts werden in der Regel aus dem Core DWH befüllt.

Data Marts beinhalten damit einen bewusst redundant gehaltenen Ausschnitt des DWH, themenspezifisch zugeschnitten auf eine bestimmte Gruppe. Dadurch erreicht man einen spezifischeren Dateninhalt als im zentralen DWH. Bei diesem Ausschnitt kann es sich zum Beispiel um die Kopie einer speziellen Produktgruppe oder eines bestimmten Zeitabschnitts handeln.

Als dezentral werden Data Marts bezeichnet, weil sie in der jeweiligen Umgebung der Abteilung aufgebaut, verwaltet und genutzt werden können. Die dahinter stehende Technologie ist bei beiden Konzepten freilich die gleiche.

Im Vergleich zu Core DWHs sind Data Marts durch den kleineren Datenbestand leichter zu pflegen. Data Marts werden in der Regel aus den Core DWH befüllt. Bei der Weitergabe sind oft weitere Transformationsprozess erforderlich, bei denen die Daten auf ein höheres Aggregationsniveau verdichtet werden.

Die folgende Tabelle gibt einen Überblick über die wichtigsten Unterschiede zwischen Core DWH und Data Marts.

Core Data Warehouse und Data Marts im Vergleich

Merkmal

Core Data Warehouse

Data Mart

Philosophie

Anwendungsneutral

Anwendungsorientiert

Adressat

Unternehmen

Abteilung

Ziel

Unterstützung aller Entscheider eines Unternehmens

Unterstützung der Entscheider einer Abteilung orientiert an den Analyseanforderungen

Ausrichtung

Zentral, unternehmensweit

Abteilungsbezogen

Anzahl

Eins bzw. wenige

Mehrere

Granularität

Gering aggregierte Daten

Höher aggregierte Daten

Endanwender-Zugriff

Zentraler Betrieb durch IT-Abteilung, Quelldatensystem für Data Marts

Direkter Zugriff

Freiheitsgrade der Analysen

Fexibel, alle Informationen können in die Analyse einfließen

Gering, Anwender ist an Abteilung gebunden

Externe Datenquellen

Hoch, alles verfügbaren externen Quellen werden integriert

Keine oder sehr gering

Datenvolumen

Hoch, 100 GB bis in TeraByte-Bereich

Gering, von ein paar GB bis 100 GB

Datenbanktechnologie

Relational

Multidimensional

Quelle: Nach Kurz (1999), Data Warehouse Enabling Technology, Bonn