Detailseite
Projekt Druckansicht

SAFE: Synthetisch Zugängliche Fragmentraumerweiterungen Basierend auf Ansätzen des Maschinellen Lernens

Fachliche Zuordnung Organische Molekülchemie - Synthese, Charakterisierung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 497017145
 
Das übergeordnete Ziel des Projekts ist die Erstellung von Vorhersagemodellen, die eine Erweiterung synthetisch zugänglicher chemischer Fragmenträume ermöglichen. Die genaue Abbildung des Raumes der synthetisch zugänglichen organischen Verbindungen stellt heute eine zentrale Herausforderung in der Wirkstoffforschung, dem Materialdesign und auch in der synthetischen Chemie dar. Große pharmazeutische Unternehmen sowie mehrere große Chemikalien-Anbieter haben sich dieser Frage mit der Definition von synthetisch zugänglichen chemischen Fragmenträumen angenommen. Da Fragmenträume reaktionsmustergesteuert sind, kann das Problem der Erweiterung auf die Vorhersage von Bausteinen heruntergebrochen werden, die mit einer bestimmten Reaktion und untereinander kompatibel sind. Auf Grundlage dieser Fragestellung sollen chemoinformatische Methoden zur Extraktion von Daten über Reaktionsschemata und Reaktanten aus Fragmenträumen entwickelt werden. Darüber hinaus sollen problemspezifische molekulare Deskriptoren für die Anwendung in der Reaktionsvorhersage entworfen werden. Auf Grundlage dieser Daten und Repräsentationen wird die Identifizierung von tolerierten Reaktanten für ausgewählte Reaktionsschemata angestrebt. Es werden moderne maschinelle Lernmodelle evaluiert und mit Daten aus den Fragmenträumen und der Literatur trainiert werden. Eine Vielzahl von Techniken von Random Forests, Support Vector Machines, Gradient Boosting bis hin zu neuronalen Netzen sollen auf ihre Fähigkeit zur Generalisierung aus den Trainingsdaten getestet werden. Zur gezielten Verbesserung der Vorhersageleistung wird eine aktive Lernstrategie mit Screening-Techniken kombiniert werden, um große Mengen an experimentellen Daten zu erzeugen. Um dieses Ziel zu erreichen, müssen neue Screening-Methoden entwickelt und evaluiert werden. Die Vorhersagekraft des Modells wird kontinuierlich experimentell validiert werden, um die Synthetisierbarkeit der Raumerweiterungen sicherzustellen. Um als produktiv identifizierte Reaktionen in den Fragmentraum zu übertragen, werden Software-Tools und ein Optimierungsschema für die Gruppierung von Reaktanten mit maximaler Kompatibilität entwickelt werden. In der letzten Phase des Projekts wird eine teilweise Automatisierung des Arbeitsablaufs angestrebt werden.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung