Detailseite
Entwicklung neuer Methoden des maschinellen Lernens zur Analyse von Sequenz- und Expressionsdaten in der Bioinformatik
Antragsteller
Dr. Harald Steck
Fachliche Zuordnung
Theoretische Informatik
Förderung
Förderung von 2001 bis 2004
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5357385
Das Ziel dieses Forschungsvorhabens ist die Entwicklung neuer Methoden der Bioinformatik zur verbesserten Analyse von Microarray-Daten (z.B. Genexpressionsdaten, Lokationsdaten). Dadurch soll ein besseres Verständnis des Zusammenwirkens der verschiedenen Zellbestandteile (Gene, Proteine, usw.) erreicht werden. Diese Interaktionen können in Form von regulatorischen Netzwerken dargestellt werden. Die besondere Herausforderung bei der Rekonstruktion der Netwerkstruktur liegt darin, daß nur relativ wenige Microarray-Daten zur Verfügung stehen, welche zudem stark vertauscht sind. Es ist beabsichtigt, folgende Probleme anzugehen: Erstens, die Entwicklung eines Ansatzes zur systematischen Planung von Experimenten. Das Ziel ist, aus der extrem großen Zahl von möglichen Experimenten nur die "vielversprechendsten" auszuwählen und tatsächlich durchzuführen. Dadurch kann ein maximaler Erkenntnisgewinn aus einer begrenzten Anzahl von Experimenten erzielt werden. Zweitens, das Auffinden neuer funktionaler Untereinheiten in einer Zelle (z.B. Stoffwechselwege), und die Bestimmung der Struktur dieser Subnetzwerke. Methodisch ist beabsichtigt, aktives Lernen einzusetzen sowie verschiedene Datenquellen zu kombinieren.
DFG-Verfahren
Forschungsstipendien
Internationaler Bezug
USA
Kooperationspartner
Professor Dr. Tommi Jaakkola