Detailseite
Projekt Druckansicht

Molekulare Deskriptoren in Matrixvervollständigungsmethoden

Fachliche Zuordnung Theoretische Chemie: Elektronenstruktur, Dynamik, Simulation
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 497201843
 
Die Kenntnis der Stoffdaten von Mischungen ist von fundamentaler Bedeutung für die Chemie und die Verfahrenstechnik. Vor kurzem haben wir Matrixvervollständigungsmethoden (MCMs) aus dem Maschinellen Lernen als neuen Ansatz zur Vorhersage der Stoffdaten von Mischungen eingeführt. Diese MCMs eröffnen auch neue Wege, um molekulare Stoffe auf Basis ihres Verhaltens in Mischungen zu charakterisieren. Idee hinter MCMs ist es, verfügbare Datensätze zu Eigenschaften binärer Mischungen in Matrizen zu speichern, in welchen Zeilen und Spalten jeweils, z.B., Lösungsmittel und gelöste Stoffe repräsentieren. Durch den Mangel an experimentellen Daten sind diese Matrizen üblicherweise nur dünn besetzt; eine MCM kann die fehlenden Einträge vorhersagen, häufig sogar genauer als etablierte physikalische Methoden, was von großer praktischer Bedeutung ist. Die MCM lernt dabei Deskriptoren der Reinstoffe (sogenannte latente Features) allein auf Basis der Mischungsdaten. Im vorliegenden Projekt werden wir diese latenten Features aus MCMs detailliert untersuchen. Insbesondere interessiert uns, wie sie mit bekannten molekularen Deskriptoren von Komponenten zusammenhängen. Dies wird uns auf der einen Seite ermöglichen, die Vorhersagemethoden für Mischungsdaten zu verbessern, indem wir hybride MCMs entwickeln. Auf der anderen Seite wollen wir die latenten Features als neue Klasse von Reinstoffdeskriptoren etablieren, welche flexibel aus Mischungsdaten abgeleitet und in vielfältiger Weise genutzt werden können, auch über MCMs hinaus. Das vorliegende Projekt wird zu den Arbeiten im SPP 2363 in seinem Schwerpunkt „design and evaluation of molecular representations for machine learning“ beitragen, Expertise aus den Bereichen Verfahrenstechnik, Maschinelles Lernen, und visueller Datenanalyse einbringen, und von der Zusammenarbeit mit der Chemie stark profitieren.
DFG-Verfahren Schwerpunktprogramme
Internationaler Bezug USA
Kooperationspartner Professor Dr. Stephan Mandt
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung