Grundlagenserie Business Intelligence

Business Intelligence (Teil 3): Datenmodellierung – Relationale und Multidimensionale Modelle

Redundanzen und Normalformen

In der Praxis werden relationale Datenbanken selten aus einem bereits existierenden Modell wie dem Entity Relationship Modell entwickelt. Oft ist es so, dass das erforderliche Datenmodell oder Teile davon aus bestehenden Berichtsstrukturen oder anderen Dokumenten generiert werden. Dabei werden oft große Tabellen definiert oder einfach Tabellen intuitiv festgelegt. Der Nachteil ist, dass dabei oft redundante Informationen gespeichert werden und die Datenbasis redundant wird.

Mit Redundanz ist das mehrfache Speichern identischer Attributswerte ein und derselben Objektausprägung gemeint. Wird beispielsweise in einer Mitarbeiterdatenbank der Name des Mitarbeiters zusammen mit der Abteilung und der Abteilungsnummer gespeichert, ist die Datenbank redundant. Das folgende Beispiel demonstriert, dass identische Werte von Abteilung und Abteilungsnummer mehrfach vertreten sein können.

Mitarbeiter

Mitarbeiter-Nr

Name

Abteilung

Abt.nummer

1

Müller

Entwicklung

12

2

Meier

Vertrieb

15

3

Klose

Entwicklung

12

4

Baumann

Vertrieb

15

Redundanzen gefährden die Konsistenz der Datenbasis und können zu so genannten Anomalien führen. Ändert sich beispielsweise die Abteilungsnummer, müssen mehrere Tupel gleichzeitig geändert werden. Dies ist nicht nur aufwändig, sondern birgt die Gefahr der Inkonsistenz. (Update-Anomalie). Verlassen alle Mitarbeiter eine Abteilung, geht auch die Information verloren, welche Abteilungsnummer der Abteilung zugeordnet ist (Deletion-Anomalie).

Um Anomalien zu verhindern, gibt es eine Vielzahl von Vorschriften und Prinzipien. Ein weit verbreitetes Verfahren, Redundanzen und Inkonsistenzen zu vermeiden, ist die Normalisierung.