Grundlagenserie Business Intelligence

Business Intelligence (Teil 4): BI-Analysemethoden OLAP & Data Mining

Gruppenbildung

Ein anderes Data Mining Verfahren ist die Clusteranalyse. Sie wird benützt, um Gruppen von Datensätzen aufzufinden, die Ähnlichkeiten aufweisen. Die Ähnlichkeiten der Objekte innerhalb einer Kategorie sollen möglichst groß, zwischen den Kategorien gering sein.

Mit der Clusteranalyse lassen sich beispielsweise bestimmte Gruppen identifizieren. Ein einfaches Exempel für eine in einer Kundendatenbank gefundene Gruppe könnte etwa folgendermaßen aussehen:

Gruppe-020: (N=103)
Bestellhäufigkeit = selten
durchschn-Bestellvol < 100
Alter > 45

Hier hat das Tool eine ältere Kundengruppe mit schwacher Bestellfrequenz gefunden. Die Clusteranalyse ermöglicht es also, profitable und weniger profitable Kunden zu unterscheiden. Mit anderen Techniken wie neuronalen Netzen lassen sich die Analysen vertiefen und konkrete Eigenschaften finden, die diese Gruppen genauer voneinander unterscheiden. Diese Eigenschaften können zum Beispiel darüber Auskunft geben, was profitable von nicht profitablen Besuchern auseinander hält.

Gruppenbildung: Die Clusteranalyse ermöglicht es, den Kundenbestand von Banken in Gruppen zu segmentieren (Quelle: CSC).
Gruppenbildung: Die Clusteranalyse ermöglicht es, den Kundenbestand von Banken in Gruppen zu segmentieren (Quelle: CSC).

Mit Clusteranalyse und Regressionsverfahren können bestehende Kunden in immer neue Gruppen aufgeteilt werden. Sie sind für die Zielgruppenbildung optimal einsetzbar. So kann ein Online-Shop ausgehend von der Bestellung von DVD-Playern vorhersagen, ob für diesen Haushalt Sonderkataloge mit speziellen Sortimenten interessant sein könnten. In der Folge gehen die Direct-Mail-Aussendungen nur an die Personengruppen, die den größten Response erwarten lassen.

Abwanderungsgefährdet: Neuronale Netze können aus bereits abgewanderten Kunden Merkmale extrahieren, die diese gemeinsam haben. Selektiert man über diese Faktoren Kunden des aktuellen Kundenbestands, erhält man die aktuell abwanderungsgefährdeten Kunden. Diese können dann gezielt „umsorgt“ werden (Quelle: CSC).
Abwanderungsgefährdet: Neuronale Netze können aus bereits abgewanderten Kunden Merkmale extrahieren, die diese gemeinsam haben. Selektiert man über diese Faktoren Kunden des aktuellen Kundenbestands, erhält man die aktuell abwanderungsgefährdeten Kunden. Diese können dann gezielt „umsorgt“ werden (Quelle: CSC).

Regelinduktion, Warenkorbanalyse, Clusteranalyse und neuronale Netze sind nur einige der vielen im Data Mining eingesetzten Verfahren. Sie werden ergänzt durch Entscheidungsbäume, genetische Algorithmen, Regessionsanalyse und anderes. Die Grafik gibt einen Überblick über die häufigsten Verfahren und ihre Anwendungen.

Überblick: Fragestellungen und mögliche Modelle und Methoden ihrer Bearbeitung (Quelle: Pepper Technologies).
Überblick: Fragestellungen und mögliche Modelle und Methoden ihrer Bearbeitung (Quelle: Pepper Technologies).