|
Data Mining Lösung in 10 Stufen Eine auf Data Mining beruhende Managementlösung bildet einen Brückenschlag zwischen den Anforderungen des Managements, sowie den zur Verfügung stehenden Technologien und Daten. Aufgrund dieser interdisziplinären Eigenschaft des Data Minings sollten Mitarbeiter aus den betroffenen Fachbereichen in den Entwicklungsprozeß der Managementlösung eingebunden werden. Dazu gehören in der Regel neben den beteiligten Marketingmanagern und Data Mining-Spezialisten noch Mitarbeiter aus der EDV-Abteilung (Datenbankadministratoren), dem Außen- und Innendienst oder den Customer Care-Abteilungen. Dabei ist ein Projektmanagement zur Koordination und Motivation der beteiligten Mitarbeiter eine unabdingbare Notwendigkeit für ein erfolgreiches Data Mining-Projekt. Denn nicht die exzellente Lösung, sondern deren Umsetzung ist letztendlich für den Erfolg verantwortlich.Generell läßt sich die Entwicklung einer Data Mining-Lösung in mehreren Stufen darstellen. Die Ausprägungen und Dauer der einzelnen Stufen hängen von der Aufgabenstellung und dem Erfahrungsschatz der beteiligten Mitarbeiter ab. Folgende 10 Stufen sind charakteristisch für die Entwicklung einer auf Data Mining beruhenden Managementlösung: |
|
|
|
|
|
|
|
|
|
In dieser Phase gilt es, das Managementproblem zu analysieren. Eine Aussage wie "wir
möchten mehr Umsatz im nächsten Jahr" oder ähnliche Generalisierungen sind dabei keine Seltenheit.
Erst durch gezieltes Nachfragen wird deutlich, daß die Umsatzsteigerung nur durch eine Ausschöpfung
bestehender Kunden oder etwa durch eine systematische Gewinnung qualitativ hochwertiger Neukunden ermöglicht
wird. Die Analyse von Rahmenbedingungen bildet einen weiteren Bestandteil der ersten Stufe. Diese lassen sich mit Hilfe eines Lösungsszenarios herauskristallisieren. Dabei wird festgestellt, welche Optionen die Data Mining-Lösung beinhalten kann und welche aus finanziellen, organisatorischen oder politischen Gründen nicht in Frage kommen. Erst wenn das Ziel klar definiert ist und die möglichen Implikationen der Data Mining-Lösung im Einklang mit den Rahmenbedingungen stehen, kann mit der Entwicklung der Data Mining-Lösung fortgefahren werden. |
|
|
|
|
|
|
|
|
Das vom Management formulierte Ziel muß in eine Data Mining-Aufgabe transformiert werden. So wird beispielsweise das Managementziel "mit Hilfe des gezielten Einsatzes von Kundenbindungsmaßnahmen die Abwanderung von Kunden zu verhindern" in das operative Ziel "wie erkenne ich, daß ein Kunde gefährdet ist" und daraus resultierend "wie läßt sich die zukünftige Abwanderungswahrscheinlichkeit eines Kunden prognostizieren" heruntergebrochen. Die Aufgabenstellung des Data Minings würde dann in der Entwicklung eines Modells zur Prognose der Abwanderungswahrscheinlichkeit von Kunden bestehen. Je genauer die Prognose, desto enger kann der Kreis der gefährdeten Kunden eingegrenzt werden und um so gezielter lassen sich Kundenbindungmaßnahmen bzw. das dafür bereitgestellte Budget einsetzen. |
|
|
|
|
|
|
|
|
Welche Daten könnten für das Data Mining nützlich sein und welche Daten stehen
zur Verfügung? Diese Frage muß im Daten-Audit beantwortet werden. In dieser Stufe werden die einzelnen
Datenfelder vorhandener Datenbanken hinsichtlich ihres möglichen Beitrages zur Lösung der Aufgabenstellung
beurteilt. Die Datenqualität der einzelnen Felder spielt bei diesem Prozeß eine wesentliche Rolle. Schwierig wird der Daten-Audit insbesondere dann, wenn die relevanten Kundeninformationen nicht in einer zentralen Marketingdatenbank, sondern unternehmensweit in unterschiedlichen Datenbanken vorliegen. Hier muß besonderen Wert auf eine mögliche Zuordnung der unterschiedlichen Daten gelegt werden. Umgesetzte Datawarehouse-Konzepte, die einen unternehmensweiten Zugriff auf Daten ermöglichen, erleichtern in solchen Fällen den Daten-Audit erheblich. Neben den im Unternehmen vorhandenen Kundeninformationen können auch externe Daten für das Data Mining herangezogen werden. So bieten Adreßbroker Informationen an, mit denen Kunden oder Interessenten zusätzlich qualifiziert werden können. |
|
|
|
|
|
|
|
|
Bei der Auswahl der Data Mining-Methode spielen neben der Aufgabenstellung noch weitere Faktoren
eine Rolle. Dazu gehört zunächst die Struktur der Daten. Handelt es sich bspw. in der Hauptsache um diskrete
Variablen oder um normalverteilte stetige Merkmale. Auch weiche Faktoren, wie die persönliche Präferenz
des Data Mining-Spezialisten, der evtl. mit einer bestimmten Methode die besten Erfahrungen gemacht hat, beeinflussen
die Methodenwahl. Es sollte darauf geachtet werden, daß bei der Auswahl der Methode das Managementziel und
kein wissenschaftliches Ziel im Vordergrund steht. Schließlich geht es in den meisten Fällen nicht darum,
die Prognose um einen Prozentpunkt zu verbessern, sondern vielmehr eine stabile, umsetzbare und praxisorientierte
Managementlösung zu entwickeln. Auch die in Stufe1 definierten Rahmenbedingungen können bei der Methodenwahl eine Rolle spielen. So kann die Transparenz und leichte Verständlichkeit der Data Mining-Lösung ein wesentlicher Erfolgsfaktor des Projektes sein. Man denke beispielsweise an den Außendienst, der wissen möchte, warum er ausgerechnet den einen Kunden besuchen soll und einen anderen nicht. Wird das Data Mining-Modell bspw. mit CHAID entwickelt, so ist die Kundenbewertung nachvollziehbar, während ein auf neuronale Netze basierendes Modell dem Außendienst höchstens eine äußerst komplexe Formel zur Begründung liefern könnte. |
|
|
|
|
|
|
|
|
Unter einem Flatfile wird in der Regel eine Datei verstanden, die alle für eine bestimmte Aufgabe relevanten Kundeninformationen enthält. Bei der Erstellung des Flatfiles sind in der Regel Aggregationsprozesse notwendig. So sind bspw. nicht alle Kaufdaten aus der Buchhaltung relevant, sondern evtl. nur deren kumulierte Höhe, das spezifische Sortimentskaufverhalten, die Anzahl der gekauften Produkte, das bevorzugte Preissegment, die Zeit seit dem letzten Kauf oder der kundenspezifische Kaufrhythmus. Es empfiehlt sich, eine Vielzahl von Sekundärdaten zu generieren, so daß das Data Mining Tool die relevanten Informationsblöcke aus einer Fülle von möglichen Merkmalen bestimmen kann. Der Phantasie des Data Miners sind dabei keine Grenzen gesetzt. |
|
|
|
|
|
|
|
|
Nach der Aggregation der Daten müssen diese noch transformiert werden. Die notwendigen Transformationen hängen unmittelbar von dem gewählten Data Mining Instrument ab. So verwenden einige Methoden nur diskrete Merkmale (CHAID), andere nur binär kodierte (Genetische Algorithmen) oder sowohl stetige, binär kodierte, als auch diskrete Merkmale (Neuronale Netze). |
|
|
|
|
|
|
|
|
Die in dem Flatfile vorhandenen Daten werden mit Hilfe des Data Mining-Instrumentes analysiert.
Die Vorgehensweise des Analyseprozesses hängt selbstverständlich von der gewählten Methode ab. So paßt sich die Struktur eines neuronalen Netzes in einem iterativen Prozeß selbständig an die gesuchte Lösung an. Dabei adaptiert das neuronale Netz Zusammenhänge, die zwischen den vorhandenen Informationen und der gesuchten Verhaltensweise von -in diesem Fall- Kunden bestehen. CHAID hingegen identifiziert zunächst das Merkmal, das den größten Einfluß auf die gesuchte Lösung hat und segmentiert die Daten nach deren Ausprägung. Anschließend werden die gebildeten Segmente nach weiteren, für die Lösung entscheidenden, Merkmalen untersucht und das Modell dementsprechend verfeinert. Bei der Verwendung der linearen Regression wird jedes einzelne Merkmal hinsichtlich seiner Auswirkung auf den zu prognostizierenden Sachverhalt untersucht und in einer linearen Zuordnungsvorschrift zusammengefaßt. Wendet man Kohonen Netze an, so werden Kunden selbständig in Cluster (Zielgruppen) eingeteilt, die in einem weiteren Schritt hinsichtlich ihrer clusterspezifischen Verhaltensweisen untersucht werden können. |
|
|
|
|
|
|
|
|
Insbesondere das Database Marketing bietet eine Fülle von Testmöglichkeiten. Die
in den Datenbanken zur Verfügung stehenden Informationen lassen eine Vielzahl von retrospektiven Analysen
zu. Mit Hilfe dieser Tests kann festgestellt werden, welche Performance die entwickelte Data Mining Lösung
in der Vergangenheit gehabt hätte. Empfehlenswert ist, bei der Entwicklung auf einen Testdatenbestand zurückzugreifen,
um später Cross-Validierungstests durchführen zu können. Dadurch kann festgestellt werden, ob die
entwickelte Lösung für die Masse der Kunden gültig ist oder ob eventuell nur samplespezifische Sachverhalte
ermittelt worden sind. Eine weitere Testmöglichkeit bietet ein simulierter Praxistest. Dabei werden Kunden mit Hilfe des entwickelten Instruments beurteilt und deren zukünftiges Verhalten beobachtet. Am Ende des Prognosezeitraums kann das vorhergesagte Verhalten dem tatsächlich gezeigten Verhalten gegenübergestellt werden. Die Qualität des Prognosemodells wird dadurch quantifizierbar. |
|
|
|
|
|
|
|
|
Nach der Testphase wird das entwickelte Tool in die betrieblichen Abläufe integriert.
Die EDV-technische Einbettung des erstellten Instrumentes hängt sowohl von der EDV-Umgebung als auch von den
organisatorischen Bedingungen des Unternehmens ab. So kann die Data Mining-Lösung sowohl in die Marketingdatenbank
integriert werden als auch auf einem externen Rechner via Schnittstellen zum Datenbankmanagementsystem betrieben
werden. Einen wesentlichen Erfolgsfaktor bilden die Aufklärung und Schulung der betreffenden Mitarbeiter. Sollten diese nicht schon während der gesamten Projektphase eingebunden worden sein, so gilt es, sie über das Ziel und die Funktionsweise der Management Lösung aufzuklären. Die Präsentation der Testergebnisse oder die exemplarische Einführung des entwickelten Modells in einer Testregion können hierzu entscheidende Beiträge liefern. |
|
|
|
|
|
|
|
|
Die Performance der entwickelten Management-Lösung sollte in regelmäßigen
Abständen untersucht werden. Dadurch ist es möglich, unterschiedliche interne und externe Einflußgrößen
auf das formulierte Ziel hin zu kontrollieren und gegebenenfalls die Lösung an neue Bedingungen anzupassen.
So kann eine Data Mining-Lösung zur Prognose des Customer-Lifetime-Value, ein Wert zur Messung des lebenslangen
Beitrages des einzelnen Kunden für das Unternehmen, beispielsweise Hinweise auf die Qualität von Neukundengewinnungsmaßnahmen
oder des aktuellen Produktportfolios geben. Sinkt der durchschnittliche Customer-Lifetime-Value, so wurden gegebenenfalls
die falschen Interessenten durch eine Kampagne angesprochen, oder das Produktportfolio ist, um ein im Sinne der
Kundenauschöpfung wichtiges Produkt, bereinigt worden. Entscheidend ist, daß die entwickelte Lösung
in ihrem oftmals komplexen Umfeld gesehen werden sollte, um so alle mit der Lösung verbundenen Möglichkeiten
voll ausschöpfen zu können. © 2000 Parsis Dastani |