Project Details
Development of a practical theory for clustering algorithms through data-driven modeling and analysis
Subject Area
Theoretical Computer Science
Term
from 2007 to 2014
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 47960847
Unter Clusteranalyse oder einfach Clustering versteht man die Partitionierung einer Menge von Objekten in Teilmengen von einander ahnlichen Objekten. Clustering-Algorithmen haben Anwendungen in der Datenkompression, Mustererkennung, Biologie, Analyse von Netzwerken, Stochastik, Textklassifikation und dem maschinellen Lernen, um nur einige Beispiele zu nennen. Die unterschiedlichen Anwendungen bestimmen auch, was unter ähnlichen Objekten zu verstehen ist. Einerseits existieren viele unterschiedliche in der Praxis erfolgreich eingesetzte Clustering-Algorithmen. Andererseits gibt es auch eine Vielzahl theoretischer Ergebnisse aus dem Bereich der theoretischen Informatik zum Clustering. Fast alle praktisch eingesetzten Algorithmen können jedoch nur unzureichend analysiert werden und die aus der Theorie stammenden Algorithmen sind nicht effizient genug für die Praxis. Wir wollen in diesem Projekt versuchen, diese Kluft zwischen Theorie und Praxis durch eine praxisorientierte Theorie für Clustering-Algorithmen zu schließen. Schwerpunkt soll dabei eine Modellierung und die hierauf aufbauende Algorithmenanalyse sein, die die Besonderheiten von Eingaben durch geeignete Parametrisierungen berücksichtigt.
DFG Programme
Priority Programmes
Subproject of
SPP 1307:
Algorithm Engineering