Detailseite
Projekt Druckansicht

Visuelle Analytik von komplexen Ereignissequenzdaten

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 449742818
 
Ereignissequenzen modellieren eine zeitliche Folge von Ereignissen. Solche Sequenzen spielen eine wichtige Rolle in zahlreichen Anwendungen. So enthalten beispielsweise elektronische Gesundheitsakten den Patienten zugeordnete medizinische Ereignisse (z.B. Diagnosen, Labortests). Ein typischer Softwareentwicklungsprozess umfasst ebenfalls eine Reihe von Ereignissen, z.B. Commits in einem Repository. In ähnlicher Weise kann die empirische Auswertung von graphischen Oberflächen das Verhalten von Benutzern aufzeichnen, z.B. Blickdaten, Tastatureingaben oder Mausklicks, die ebenfalls durch Ereignissequenzen modelliert werden können. In diesem Projekt wollen wir neue Analyse- und Visualisierungstechniken entwickeln, um Benutzer bei der Gewinnung von Erkenntnissen aus Ereignissequenzdaten in verschiedenen Anwendungsbereichen zu unterstützen. Wie können wir in einer großen Anzahl von Ereignissequenzen Muster entdecken, so dass die Benutzer zugrundeliegende Zusammenhänge identifizieren, Kausalitäten innerhalb einer Sequenz interpretieren und sogar zukünftige Ereignisse vorhersagen können? Leider sind reale Ereignissequenzen in der Regel groß, variieren in der Art der Ereignisse und der Länge der Sequenzen, und Ereignisse können in verschiedenen Reihenfolgen auftreten und unterschiedlich lange dauern, was die Zusammenfassung von Ereignismustern erschwert. Wir beabsichtigen, eine neue visuelle Analysemethode für komplexe Ereignissequenzdaten zu entwickeln, die Verfahren aus dem Data Mining und dem maschinellen Lernen erweitert und diese in eine interaktive Pipeline für die visuelle Analyse integriert.Konkret werden wir zunächst Techniken zur Vorverarbeitung und Bereinigung komplexer Sequenzdaten entwickeln, um die Relevanz von Ereignissen abzuschätzen, lange Sequenzen durch semantische Informationen in Segmente zu zerlegen, Sequenzen unterschiedlicher Länge anzugleichen und Rauschen aus den Eingabedaten zu entfernen. Danach werden wir eine wissensbasierte Repräsentationslerntechnik entwickeln, die verschiedene Arten von Ereignissen mit Hilfe ihrer semantischen Beziehungen in eine einheitliche Merkmalsdarstellung transformiert. Mit dieser Merkmalsdarstellung werden wir uns dann auf visuelle Analysetechniken für die mehrskalige Zusammenfassung von Sequenzen, die Analyse von Kausalität, die Vorhersage von Ereignissen und die Erkennung von Anomalien konzentrieren. Wir werden die Datenvorverarbeitungs-, Analyse- und Visualisierungstechniken in ein visuelles Analyse-Tookit für Ereignissequenzdaten integrieren. Schließlich werden wir unsere Techniken auf ein breites Spektrum wichtiger Szenarien anwenden: neue Datenanalysemethoden für elektronische Gesundheitsakten, empirische Benutzerstudien und Sequenzdaten in der Softwaretechnik.Insgesamt erwarten wir sowohl grundlegende Erkenntnisse für die visuelle Analyse von Sequenzdaten im Allgemeinen als auch praktische Verbesserungen für die drei Anwendungsbeispiele.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug China
Kooperationspartner Professor Dr. Nan Cao
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung