Detailseite
Lernen mittels Distanzdaten mit Anwendungen in der Krebsforschung
Antragstellerin
Dr. Julia Vogt
Fachliche Zuordnung
Theoretische Informatik
Bioinformatik und Theoretische Biologie
Bioinformatik und Theoretische Biologie
Förderung
Förderung von 2013 bis 2016
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 238232249
Traditionelle Methoden im Bereich Maschinelles Lernen basieren gewöhnlich auf vektoriellen Daten. Häufig ist jedoch keine Information über die zugrunde liegende vektorielle Repräsentation der Daten vorhanden, sondern lediglich paarweise Ähnlichkeiten oder Distanzen werden gemessen. Beispiele für solche Datensätze sind alle Arten von Kernmatrizen, wie Sequenzalignmentkerne über DNA oder Protein Sequenzen, oder Diffusionskerne an Graphen. Das Hauptziel des Projektes besteht darin, neue Methoden im Bereich Maschinelles Lernen zu entwickeln, die auf relationalen Daten beruhen und keinen direkten Zugang zum zugrundeliegenden Vektorraum benötigen. Diese neuen Methoden werden dann auf Datensätze ohne offensichtliche Vektorraumrepräsentation angewandt. Die Anwendungsgebiete umfassen alle Datensätze, die als paarweise Distanzen vorliegen. Da Mercer-Kerne Ähnlichkeiten zwischen vielen verschiedenen Arten von Objekten messen können (wie z.B. Kerne an Graphen, Bildern, Strukturen oder Strings) haben die hier vorgeschlagenen Methoden einen sehr breiten Anwendungsbereich. Der Hauptanwendungsbereich liegt in der Datenanalyse von Krebsdaten, welche vom Memorial Sloan- Kettering Cancer Center zur Verfügung gestellt werden.
DFG-Verfahren
Forschungsstipendien
Internationaler Bezug
USA
Gastgeber
Professor Dr. Gunnar Rätsch