Grundlagenserie Business Intelligence
Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle
Das Star-Schema
Eine besondere Form des multidimensionalen Datenmodells ist das Star-Schema. Das Schema hat sich zur Abbildung multidimensionaler Datenstrukturen in relationalen Datenbanken zum Standard entwickelt und wird vor allem in Data Warehouses und OLAP-Anwendungen eingesetzt.
Das Star-Schema versucht, die große Anzahl an Tabellen, wie sie im relationalen Modell typisch sind, zu minimieren. Die Bezeichnung Star-Schema rührt daher, dass die Tabellen sternenförmig angeordnet werden.
Dabei müssen zwei verschiedene Arten von Tabellen unterschieden werden. Im Zentrum steht die Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren. Beide werden durch Rechtecke symbolisiert. Die Faktentabelle dient zur Speicherung der Zahlen oder abgeleiteten Größen, also etwa Umsätze oder Kosten. Aus Würfelperspektive enthält sie den Würfelkern. Die Dimensionstabellen enthalten die qualitativen Daten zur Visualisierung der Dimensionen und Dimensionshierarchien.
Die einzelnen Zeilen einer Dimensionstabelle werden durch eine minimale Attributkombination, dem Primärschlüssel, identifiziert. Zur Herstellung der Beziehung zwischen den Dimensionstabellen und der zugehörigen Fakttabellen werden die Primärschlüssel der Dimensionstabellen in die Fakttabelle als Fremdschlüssel aufgenommen und bilden dort wiederum zusammen den Primärschlüssel der Fakttabelle. Die folgende Abbildung verdeutlicht dies.
Die folgende Abbildung zeigt ein konkretes Beispiel zum Star-Schema.
Ziel des Star-Schemas ist nicht die Normalisierung, sondern eine Optimierung auf effiziente Leseoperationen. Beim Star-Schema liegen die Dimensionstabellen deshalb denormalisiert vor: Es existieren funktionale Abhängigkeiten zwischen Nicht-Schlüsselattributen, so dass die dritte Normalform verletzt wird. Diese Verletzung nimmt man aber in Kauf, denn die Datenstruktur ermöglicht einebessere Verarbeitungsgeschwindigkeit zu Lasten der Datenintegrität und des Speicherplatzes.