Project Details
Multiple Protein Alignment Algorithmen mit Splitmetriken und Validierung von Phylogenien
Applicant
Professor Dr. Ralf Zimmer
Subject Area
Computer Science
Term
from 1998 to 2001
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5132288
Für die biologische Analyse und Interpretation von Proteinsequenzen, die zur Zeit im großen Umfang aus Sequenzierungsprojekten gewonnen werden, sind Phylogenien (Stammbäume) und multiple Alignments von essentielles Bedeutung. Sie erlauben das Auffinden von Sequenz- und Struktur-Ähnlichkeiten zu bereits bekannten Proteinen und ermöglichen damit Hypothesen über die molekulare und zelluläre Funktion der neuen Sequenz. Das vorliegende Projekt hat zum Ziel einen Algorithmus zu entwickeln und zu implementieren, der das Lösen der eng verwandten Probleme -Konstruktion der Phylogenie -Konstruktion des multiplen Alignments für eine Menge von Protein-Sequenzen und -Strukturen in einem neuartigen integrierten Ansatz vereint. Das Verfahren basiert auf der Behandlung von Sequenz-Distanzen durch sogenannte Splitmetriken und berechnet entsprechende evolutionäre Netze verschränkt mit den Distanzen. Dabei werden alle mit den unterliegenden Sequenzdaten kompatiblen Bäume und die sie bestimmenden zugehörigen multiplen Alignments berechnet. Der Algorithmus beruht auf einer sukzessiven Berechnung von Profil-Alignments, wie sie auch bei anderen Verfahren eingesetzt werden bzw. einsetzbar sind. Die Qualität dieser Profil-Alignments hat entscheidenden Einfluss auf die Ähnlichkeits- und Distanzmaße und damit auf die Gesamtperformance des Algorithmus. Deshalb ist die Verbesserung und theoretische Absicherung von Profil-Alignments und der zugehörigen Bewertungsfunktionen von vorrangiger Bedeutung für das Projekt.
DFG Programme
Priority Programmes