Grundlagenserie Business Intelligence

BI-Methoden (Teil 2): Data Mining Phasen und Vorgehensschritte

Analysen durchführen

Stehen die Ziele fest, können die Analyseverfahren ausgewählt werden. Zur Verfügung stehen Clusterverfahren, Entscheidungsbaumanalyse, Neuronale Netze und Assoziationsregelverfahren, sowie weitere, weniger häufig eingesetzte Methoden. Die Verfahren werden ausführlicher in einem eigenen Beitrag vorgestellt.

Die einzelnen Verfahren unterstützen unterschiedliche Zielsetzungen des Data Mining. So bieten sich neuronale Netze und lineare Regression bei Fragestellungen mit Prognosecharakter an. Kohonen-Netze und regelbasierte Systeme werden oftmals beim Clustering verwendet.

Eine eindeutige Zuordnung der Instrumente nach Aufgabenstellung ist jedoch nicht möglich. Oftmals werden mehrere Data-Mining-Lösungen für dieselbe Aufgabenstellung entwickelt und gegeneinander ausgetestet. Auch die Kombination unterschiedlicher Methoden innerhalb einer Lösung ist möglich.

Ziele und Methoden: Die aufgeführten Ziele lassen sich mit unterschiedlichen Methoden erreichen.
Ziele und Methoden: Die aufgeführten Ziele lassen sich mit unterschiedlichen Methoden erreichen.

Die zu findenden Muster sollten mehrere der folgenden Eigenschaften erfüllen:

  • Sie sollten verständlich sein: Es sollte möglich sein, das Ergebnis in einer leicht verständlichen Sprache zu formulieren oder in kompakter graphischer Form darzustellen.

  • Sie sollten neu sein, also nicht altbackene Weisheiten wiedergeben.

  • Sie sollten nützlich sein. Die Resultate sollten verwendbar und für das Unternehmen relevant sein.

  • Schließlich sollten die Ergebnisse auch langfristig gültig sein und mit hoher Gewissheit auch künftig gelten.

Nicht zuletzt dürfen die Ergebnisse nicht trivial sein. Sehr viele Datenbank-Systeme können Resultate liefern, die alle bis jetzt angeführten Eigenschaften besitzen. Der Unterschied ist, dass diese mit Hilfe von trivialen Methoden berechnet werden, z.B. durchschnittliches Einkommen aller Männer unter 30 Jahren in Deutschland. Beim Data Mining werden aber komplexe und nicht leicht erkenn- und ermittelbare Zusammenhänge entdeckt.