Angebot an "Datenware"
Ähnlich wie ein Kaufhaus muss sich auch ein Data Warehouse dynamisch der Nachfrage anpassen. Vergleichbar mit einem Versandhaus, bei dem der Nutzer die für seine Aufgabenstellungen relevanten Daten bestellt, wird der Zweck des Data Warehouse umso besser erfüllt, je mehr Informationswünsche des Bestellers direkt erfüllt werden können: ohne dass weitere Datenlager durchsucht werden müssen, d.h. je vollständiger das Angebot an "Datenwaren" ist.
Zu den Techniken gehören automatische Regressionsanalysen (Scoring) für große Einflussanalysen, Entscheidungsbäume (Kundensegmentierungen) und Neuronale Netze sowie Assoziationsanalysen. Wichtige Analysefälle sind bereits vordefiniert, sodass sich Marketinganwender nicht in die technischen Details von komplizierten Data-Mining-Verfahren einarbeiten müssen, um trotzdem aussagefähige Analyseergebnisse zu erhalten. Stichproben, Datenbereitstellung: Ausgangspunkt aller Data Mining Projekte ist die Datenbereitstellung (Input Node). Nach der Festlegung der Eingabedatei folgen Einzelheiten zu den Analyse- und Zielvariablen. Die Geschwindigkeit von Auswertungen kann mit Stichproben beschleunigt werden. Vgl. Jörg Becker: Data Mining als Wissensbilanz-Zubringer, ISBN 978-3-8370-2163-9.
Mit den Möglichkeiten einer 3-dimensionalen Datenexploration für große Datenmengen können Muster und Trends erkannt sowie Ausreißer entfernt werden. Mit Clusteranalysen können Gruppen von „ähnlichen" Beobachtungen gebildet werden. Damit können auch für große Datenmengen Prognose- und Scoringmodelle entwickelt werden. Ergebnisse können an Verfahren wie Entscheidungsbäume, neuronale Netze oder beliebig andere Prozeduren übergeben werden. Bei allen Schritte können dazugehörige statistische Grundkennziffern berechnet werden. Vgl. Jörg Becker: Wissensbilanz mit Kundenbarometer, ISBN 978-3-8370-5177-3.
Nach dem Data Warehouse-Prinzip konzipierte Systeme enthalten Daten und Meta-Daten. Die „Metabase", d.h. eine Datenbank in der Datenbank mit Informationen über die Information, übernimmt die Rolle des Katalogs: analog zu Versandhaus erhält ein potentieller Besteller über den Katalog entsprechende Informationen über die mit ihrer Beschreibung angebotenen Daten. Diese Metadaten enthalten zum einen die Abbildungsregeln. Daneben werden auch Hierarchien, Dimensionen und die „Würfel" für die mehrdimensionale Analyse bereitgestellt. Impliziter Bestandteil der Informationen eines Data Warehouse ist ihre zeitliche Variabilität. Im Gegensatz zu Daten, mit denen immer nur der momentane Ist-Zustand der Geschäftsaktivitäten abgebildet werden kann, lassen sich mit Data-Warehouse-Daten Trendanalysen durchführen. Denn das Data Warehouse wird mit Momentaufnahmen derselben Information zu verschiedenen Zeitpunkten gefüllt und erlaubt so Vergleiche und Aussagen über Entwicklungen bestimmter Faktoren.Vgl. Jörg Becker: Data Mining als Wissensbilanz-Zubringer, ISBN 978-3-8370-2163-9.
Jörg Becker
www.beckinfo.de