Grundlagenserie Business Intelligence
Business Intelligence (Teil 4): BI-Analysemethoden OLAP & Data Mining
Gruppenbildung
Ein anderes Data Mining Verfahren ist die Clusteranalyse. Sie wird benützt, um Gruppen von Datensätzen aufzufinden, die Ähnlichkeiten aufweisen. Die Ähnlichkeiten der Objekte innerhalb einer Kategorie sollen möglichst groß, zwischen den Kategorien gering sein.
Mit der Clusteranalyse lassen sich beispielsweise bestimmte Gruppen identifizieren. Ein einfaches Exempel für eine in einer Kundendatenbank gefundene Gruppe könnte etwa folgendermaßen aussehen:
Gruppe-020: (N=103)
Bestellhäufigkeit = selten
durchschn-Bestellvol < 100
Alter > 45
Hier hat das Tool eine ältere Kundengruppe mit schwacher Bestellfrequenz gefunden. Die Clusteranalyse ermöglicht es also, profitable und weniger profitable Kunden zu unterscheiden. Mit anderen Techniken wie neuronalen Netzen lassen sich die Analysen vertiefen und konkrete Eigenschaften finden, die diese Gruppen genauer voneinander unterscheiden. Diese Eigenschaften können zum Beispiel darüber Auskunft geben, was profitable von nicht profitablen Besuchern auseinander hält.
Mit Clusteranalyse und Regressionsverfahren können bestehende Kunden in immer neue Gruppen aufgeteilt werden. Sie sind für die Zielgruppenbildung optimal einsetzbar. So kann ein Online-Shop ausgehend von der Bestellung von DVD-Playern vorhersagen, ob für diesen Haushalt Sonderkataloge mit speziellen Sortimenten interessant sein könnten. In der Folge gehen die Direct-Mail-Aussendungen nur an die Personengruppen, die den größten Response erwarten lassen.
Regelinduktion, Warenkorbanalyse, Clusteranalyse und neuronale Netze sind nur einige der vielen im Data Mining eingesetzten Verfahren. Sie werden ergänzt durch Entscheidungsbäume, genetische Algorithmen, Regessionsanalyse und anderes. Die Grafik gibt einen Überblick über die häufigsten Verfahren und ihre Anwendungen.