Detailseite
Gleichzeitiges Aufdecken von Strukturvarianten in mehreren Genomen mit Hilfe von Linked-Read Sequenzierungsdaten
Antragstellerin
Professorin Dr. Birte Kehr
Fachliche Zuordnung
Humangenetik
Bioinformatik und Theoretische Biologie
Bioinformatik und Theoretische Biologie
Förderung
Förderung seit 2019
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 400728090
Das menschliche Genom enthält Zehntausende von Strukturvarianten (SVs), die phänotypische Merkmale beeinflussen und genetische Krankheiten verursachen können. SVs sind jedoch aufgrund ihrer Länge und ihrer häufigen Lage in repetitiven Regionen des Genoms notorisch schwer aus short-read Sequenzierungsdaten zu ermitteln. Daher verwenden wir linked-read Sequenzierungsdaten für die Erstellung eines umfassenden SV-call-sets für die Kohorte der seltenen Krankheiten der FOR2841. Unter Ausnutzung der in linked-read Daten enthaltenen weitreichenden Informationen haben wir in der ersten Förderperiode erfolgreich das Software-Tool bcmap entwickelt, das eine ultraschnelle Extraktion von Reads aus einem bestimmten genomischen Intervall ermöglicht, ohne ein Read-Alignment zu berechnen (Lüpken R und Kehr B, in Begutachtung). Bis zum Ende der ersten Förderperiode werden wir bcmap zu einem genomweiten, lokalen Assemblierungsansatz weiterentwickeln, der SVs umfassender detektieren kann als derzeitige short-read oder linked-read Analysetools, und ein umfassendes SV-call-set für die FOR2841-Krankheitskohorten erstellen (Lüpken et al. submitted). Darüber hinaus haben wir kürzlich die Software-Tools PopDel (Niehus et al. Nat Commun 2021) und PopIns2 (Krannich et al. Bioinformatics 2022) zur Identifizierung von SVs in short-read-Sequenzierungsdaten entwickelt. PopDel und PopIns2 rufen SVs in den Daten vieler Individuen gleichzeitig auf und erzielen dadurch zuverlässigere SV-call-sets als bisherige Ansätze. In der zweiten Förderperiode wollen wir unseren linked-read SV-calling Ansatz erweitern, um Daten von mehreren Individuen gleichzeitig zu berücksichtigen. Unseres Wissens nach ist derzeit kein anderer linked-read SV-caller dazu in der Lage. Die daraus resultierenden call-sets versprechen zuverlässiger zu sein und werden eine bessere Filterung nach krankheitsrelevanten Varianten ermöglichen. Dies ist besonders im Zusammenhang mit den Kohorten für seltene Krankheiten der FOR2841 von Bedeutung und kann die diagnostische Odyssee für Patienten mit seltenen Krankheiten verkürzen.
DFG-Verfahren
Forschungsgruppen