eduglopedia.org

Summary

Ziel dieses Moduls ist es, die Teilnehmer/-innen in grundlegende Fragestellungen, Techniken und Anwendungen des Data Mining einzuführen, ihnen anhand von Fallstudien die konkrete Bedeutung dieser Techniken aufzuzeigen und darzulegen, wie sich aus Mining-Resultaten Rückschlüsse auf den Kunden sowie auf das unternehmerische Management von Kundenbeziehungen ergeben können. Das Modul wird durch praktische Übungen mit und verschiedene Präsentationen von Data Mining-Werkzeugen ergänzt.

Unternehmen sehen sich einer rasant wachsenden Datenflut gegenüber, die dadurch entsteht, dass Daten jeglicher Art elektronisch erfasst werden, dass Prozesse und Geschäftsvorgänge elektronisch abgewickelt werden und dass zahlreiche Applikationen Daten selbstständig erzeugen. Man ist dann mit dem Problem konfrontiert, aus diesen Daten Wissen abzuleiten. Data Mining ist ein Sammelbegriff für Techniken, die dieser Herausforderung begegnen wollen, und ist zentraler Teil eines Prozesses, den man auch als Knowledge Discovery in Databases (KDD) bezeichnet. Data Mining setzt typischerweise auf einem Datenlager (Data Warehouse) auf, das seinerseits aus einer homogenen oder einer heterogenen Sammlung von operationalen Datenbanken oder anderen Datenbeständen erzeugt wird.

Der schon fast „klassische“ Anwendungsbereich ist der elektronische Handel, bei dem über Techniken des Data Mining versucht wird, den jetzt elektronischen Kunden zu erkennen („User Profiling“) und einzuordnen, etwa um den Umgang mit ihm zu individualisieren und zu personalisieren oder um die Beziehung des Unternehmens zum Kunden nach seinen Wünschen und Bedürfnissen gestalten zu können („Customer Relationship Management“). Zahlreiche weitere Anwendungsbereiche finden sich in anderen IT-Feldern und in der künstlichen Intelligenz.

In diesem Modul wird der Bereich des Data Mining ganzheitlich  argestellt. Zu analysierende Daten müssen vor dem eigentlichen Mining etwa einer geeigneten Vorbereitung („Säuberung“, Data Cleansing) unterzogen werden, z.B. um Inkonsistenzen zwischen unterschiedlichen Datenbeständen auszugleichen, Datenformate aneinander anzupassen, Detaillierungsunterschiede auszugleichen oder Daten in ein einheitliches Modell zu transformieren. Sodann lernen die Teilnehmer/-innen die Herleitung von Assoziationsregeln, die Analyse von Sequenzen, die Erstellung von Klassifikationen und Regressionen sowie die Bildung und Analyse von Clustern (Gruppen) kennen.

Von zunehmender Bedeutung sind Data Mining-Techniken heute im Zusammenhang mit dem World Wide Web, da gängige Web-Server umfangreiche Protokolldaten erfassen. Aus diesen lassen sich neben angeforderten Seitenadressen z. B. Zugriffspfade, Suchstrings, Eintritts- sowie Austrittspunkte oder der verwendete Browser entnehmen, was Rückschlüsse sowohl auf die Struktur und den Inhalt der betreffenden Website als auch auf deren Besucher erlaubt. Im zweiten Teil des Moduls werden die erlernten Techniken auf diesen Bereich angewendet. Es wird sich dabei z.B. zeigen, wie man zu einem auch von manchen Suchmaschinen verwendeten Page-Ranking kommen kann.

Anhand konkreter Fragestellungen und Fallstudien z. B. aus dem Dienstleistungsmarketing, dem Gütermarketing oder dem Weblog-Mining werden die erarbeiteten Techniken erprobt, und es wird aufgezeigt, welche konkreten Implikationen sich für die einzelne Unternehmung insbesondere für den elektronischen Handel ergeben können. Besonders hilfreich sind dabei Visualisierungstechniken, die heute in zunehmendem Maße auch von Data Mining-Werkzeugen eingesetzt werden.

Duration in days 5
Presence of students On-campus
Comments

Editors

 
Feedback