Wenn Algorithmen entscheiden
Data Mining Tools
Ein weitverbreitetes Tool für das Data Mining ist der IBM SPSS Modeler. Die umfassende Predictive-Analytics-Plattform soll eine prädiktive Intelligenz in die Entscheidungen von Einzelpersonen, Gruppen, Systemen und Unternehmen bringen. Der SPSS Modeler nutzt hoch entwickelte Algorithmen und Techniken inklusive Text- und Datenanalysen, Entity Analytics, Decision Management und Optimierungen. Damit kann der Nutzer dieser Plattform wiederkehrende Muster und Trends in strukturierten oder unstrukturierten Daten erkennen und daraus Vorhersagemodelle schnell und intuitiv erstellen, ohne selbst programmieren zu müssen.
Ein laufender Data-Mining-Prozess wird über eine intuitive grafische Oberfläche visualisiert. Über diese Schnittstelle kann der Nutzer auf numerische und tabellarische Daten aus einer Vielzahl von Quellen zugreifen, z. B. Text-, Web-2.0- oder Excel-Sheets. Auch Umfragedaten lassen sich zur Modellierung heranziehen, um Geschäftsergebnisse in so unterschiedlichen Bereichen wie CRM, Marketing, Ressourcenplanung, Betrugserkennung, Risikominderung und medizinische Forschung zu verbessern.
Schliesslich kann der Nutzer die Ergebnisse seiner Analyse modellieren und dabei verstehen lernen, welche Faktoren die erhaltenen Aussagen beeinflussen. Das soll ihm dabei helfen, neue Chancen zu nutzen, konsistent die richtigen Entscheidungen zu treffen und Risiken zu mindern. Der Nutzer greift über eine einzige Schnittstelle sowohl auf alle prädiktiven Funktionen des IBM SPSS Modelers sowie auf die Datenumwandlungs-, Hypothesentest- und Berichtsfunktionen von IBM SPSS Statistics zu. IBM SPSS gibt es in vier Versionen: Personal, Professional, Premium und Gold. Der jeweilige Nutzer entscheidet, in welcher Version und mit welchen Auflagen er die einzelnen Pakete nutzt, was den Preis bestimmt.
Verfügt man über genügende Kapazitäten und Know-how im eigenen Unternehmen, liegt es nahe, auf Open Source Data Mining Tools zurückzugreifen. Je nach Fokus stehen verschiedene Tools mit verschiedenen Schwerpunkten zur Verfügung, so zum Beispiel Apache Mahout, DataMelt, ELKI, Knime, Orange oder Rattle. Aber dies ist nur die Spitze des Eisbergs, denn die Auswahl ist riesengross.
Autor(in)
Rüdiger
Sellin