Grundlagenserie Business Intelligence

Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle

Primärschlüssel und Erste Normalform

Die Normalformenlehre geht auf den Erfinder der relationalen Datenbank, Edgar Codd, zurück. Er entwickelte mathematische Regeln, die relationale Datenbanken in redundanzfreie oder zumindest redundanzärmere Datenstrukturen überführen. Im Kern besteht dieser Prozess in drei Normalisierungsschritten.

Die Definition der Ersten Normalform lautet:

Eine Tabellenzeile darf nur einen Attributwert enthalten (technisch: Der Attributwert muss atomar sein). Kommen in einer Tabelle Wiederholungsgruppen vor, so muss für jeden Wert der Wiederholungsgruppe eine eigene Tabellenzeile geschaffen werden.

Als Beispiel verwenden wir eine Reisekostentabelle.

Reisekosten

Rechnungsnummer

Datum

Name, Vorname, Straße, PLZ, Ort

Kostenart

Anzahl Einzelvergütung

Um die Tabelle in die Erste Normalform zu überführen, müssen die Mehrfachbelegungen der Felder eliminiert werden. Also müssen „Name“, „Vorname“, „Straße“, „PLZ“ und „Ort“ in eigene Spalten gesetzt werden.

Reisekosten

Rechnungsnummer

Datum

Name

Vorname

Straße

PLZ

Ort

Kostenart

Anzahl Einzelvergütung

Besondere Beachtung verdienen die fett gedruckten Spalten Rechnungsnummer und Kostenart. Sie bilden den so genannten Primärschlüssel dieser Tabelle, das bedeutet, dass jedes Tupel eindeutig durch Rechnungsnummer und Kostenart identifiziert wird. Die Rechnungsnummer alleine genügt nicht als Primärschlüssel, da zu jeder Rechnungsnummer mehrere Kostenarten gehören können.

Mit Hilfe dieses Primärschlüssels lassen sich nun Verknüpfungen zwischen verschiedenen Tabellen herstellen.