In diesem Kurs werden grundlegende Kenntnisse im Bereich der Datenanalyse vermittelt. Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse. Das Spektrum an Anwendungen ist breit und umfasst sowohl wirtschaftliche als auch wissenschaftliche Datenbestände: Klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, sowie Natur- und Ingenieurswissenschaften. In allen Bereichen besteht der Wunsch aus sehr großen Datenbeständen interessante Zusammenhänge zu extrahieren.
In dem Kurs geht es sowohl um die Aufbereitung von großen Datenbeständen als Voraussetzung für eine schnelle und leistungsfähige Analyse als auch um moderne Data Mining Techniken für die Analyse an sich. Anhand von aktuellen Anwendungen werden die grundlegenden Data Mining Problemstellungen aufgezeigt. Der Schwerpunkt liegt auf Data Mining Algorithmen zur Wissensextraktion und bildet die einzelnen Schritte des Knowledge Discovery in Databases (KDD) Prozess ab. Es werden die grundsätzlichen Data Mining Problemstellungen vorgestellt und verschiedene algorithmische Lösungen aus jedem Bereich verglichen. Darüber hinaus werden grundsätzliche Evaluierungsmethoden vorgestellt, um diese Data Mining Lösungen für konkrete Anwendungen bewerten zu können.
Overview
Taught by
Emmanuel Müller