Grundlagenserie Business Intelligence
BI-Datenmanagement (Teil 2): Das Data Warehouse
Das dezentrale DWH – Data Marts
Die bereits mehrfache erwähnten Data Marts können als dezentrale DWHs aufgefasst werden, also in kleinere Einheiten zerlegte DWHs. Sie sind gekennzeichnet durch einen engeren Fokus, eine starke Anwendungsorientiertheit und ein deutlich geringeres Datenvolumen im Vergleich zu Core DWHs. Vor allem sind Data Marts auf spezielle Nutzerkreise ausgerichtet.
Data Marts beinhalten damit einen bewusst redundant gehaltenen Ausschnitt des DWH, themenspezifisch zugeschnitten auf eine bestimmte Gruppe. Dadurch erreicht man einen spezifischeren Dateninhalt als im zentralen DWH. Bei diesem Ausschnitt kann es sich zum Beispiel um die Kopie einer speziellen Produktgruppe oder eines bestimmten Zeitabschnitts handeln.
Als dezentral werden Data Marts bezeichnet, weil sie in der jeweiligen Umgebung der Abteilung aufgebaut, verwaltet und genutzt werden können. Die dahinter stehende Technologie ist bei beiden Konzepten freilich die gleiche.
Im Vergleich zu Core DWHs sind Data Marts durch den kleineren Datenbestand leichter zu pflegen. Data Marts werden in der Regel aus den Core DWH befüllt. Bei der Weitergabe sind oft weitere Transformationsprozess erforderlich, bei denen die Daten auf ein höheres Aggregationsniveau verdichtet werden.
Die folgende Tabelle gibt einen Überblick über die wichtigsten Unterschiede zwischen Core DWH und Data Marts.
Merkmal |
Core Data Warehouse |
Data Mart |
Philosophie |
Anwendungsneutral |
Anwendungsorientiert |
Adressat |
Unternehmen |
Abteilung |
Ziel |
Unterstützung aller Entscheider eines Unternehmens |
Unterstützung der Entscheider einer Abteilung orientiert an den Analyseanforderungen |
Ausrichtung |
Zentral, unternehmensweit |
Abteilungsbezogen |
Anzahl |
Eins bzw. wenige |
Mehrere |
Granularität |
Gering aggregierte Daten |
Höher aggregierte Daten |
Endanwender-Zugriff |
Zentraler Betrieb durch IT-Abteilung, Quelldatensystem für Data Marts |
Direkter Zugriff |
Freiheitsgrade der Analysen |
Fexibel, alle Informationen können in die Analyse einfließen |
Gering, Anwender ist an Abteilung gebunden |
Externe Datenquellen |
Hoch, alles verfügbaren externen Quellen werden integriert |
Keine oder sehr gering |
Datenvolumen |
Hoch, 100 GB bis in TeraByte-Bereich |
Gering, von ein paar GB bis 100 GB |
Datenbanktechnologie |
Relational |
Multidimensional |
Quelle: Nach Kurz (1999), Data Warehouse Enabling Technology, Bonn |