Grundlagenserie Business Intelligence

Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle

Multidimensionale Modelle

In BI-Analysen werden oft multidimensionale Datenräume betrachtet, wie sie OLAP-Analysen zu Grunde liegen. Eine beispielhafte Fragestellung für solche Analysen wäre etwa: Welcher Umsatz wurde mit Produkt 1 (1. Dimension) in der Region Ost (2. Dimension) im Jahr 2005 (3. Dimension) gemacht. Dabei werden die drei Dimensionen Produkt, Region und Zeit abgefragt.

Die resultierende Datenstruktur bildet im dreidimensionalen Fall einen Würfel, den Cube. Die folgende Abbildung zeigt den Cube für das erwähnte Beispiel.

Dreidimensionale Datenräume spannen einen Würfel auf.
Dreidimensionale Datenräume spannen einen Würfel auf.

Mehrdimensionale Datenräume sind durch mehrere Aspekte gekennzeichnet. Vor allem Fakten, Dimensionen und Hierarchisierung spielen eine Rolle.

Fakten oder „Measures“ sind in der Regel Zahlen wie Umsatzerlöse, Mengen oder Kosten, die im Mittelpunk der Datenanalyse stehen. Sie stehen im Inneren des Datenwürfels. Es handelt sich meist um betriebswirtschaftliche Kennzahlen, die die Aufgabe haben, Zusammenhänge in verdichteter, quantitativer Form wiederzugeben. Dabei kann es sich um Basisgrößen (atomare Werte) oder abgeleitete Zahlen (berechnete Werte) handeln.

Die Dimensionen sind deskriptiver Natur und stellen im dreidimensionalen Fall die Achsen des Würfels dar. Sie bilden die unterschiedlichen qualitativen Gesichtspunkte ab. Eine Visualisierung erfolgt im zweidimensionalen Fall als Tabelle (Matrix) und im dreidimensionalen Fall als Würfel.

Bei mehr als drei Dimensionen lassen sich die Daten als Hyperwürfel veranschaulichen. Der 4-dimensionale Hyperwürfel wird auch als Tesseract bezeichnet. Mehr Informationen dazu gibt das Dokument „Der n-dimensionale Hyperwürfel“, eine Java-Animation liefert anschauliche Beispiele.

Hierarchisierungen schließlich sind vertikale, hierarchische Beziehungen innerhalb von Dimensionen. Dies ermöglicht die Betrachtung unterschiedlicher Verdichtungsstufen der Daten. Beispielsweise kann die Dimensionsausprägung „Mitarbeiter“ hierarchisiert werden in „Filiale“, „Region“, „Land“ und „Gesamt“.