Detailseite
Projekt Druckansicht

ScalableMine: Skalierbares hierarchisches Process Mining in Ereignis-Strom-Systemen

Fachliche Zuordnung Softwaretechnik und Programmiersprachen
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung seit 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 496119880
 
Zu den Herausforderungen im Process Mining gehört Skalierbarkeit, also das Bewältigen von Volumen, Geschwindigkeit und Variabilität der Eingabedaten, insbesondere in Online-Kontexten mit Ereignis-Strömen. Online bedeutet in diesem Kontext, dass die Ereignisse unmittelbar bei der Ankunft in einem kontinuierlichen Strom verarbeitet werden. Skalierendes Process Mining ist erforderlich, damit das Process Mining als kontinuierliche unternehmensweite Aktivität etabliert werden kann und somit nicht als einzelnes Projekt gesehen wird. Somit benötigen wir eine skalierbare Verarbeitung von kontinuierlichen Ereignis-Strömen und Prozess-Fragmenten in Cloud-Infrastrukturen zum effizienten und effektiven Streaming Process Mining. Skalierbarkeit ist die Fähigkeit eines Softwaresystems steigende Lasten mit angemessener Performance zu bewältigen, wobei Hardware-Ressourcen ergänzt werden können. Bei der Betrachtung kontinuierlichen Ströme von Ereignissen ist häufig eine Integration mehrerer solcher Ströme erforderlich. Mit dem traditionellen Ansatz zum Process Mining, zunächst alle Ereignisse in eine (relationale) Datenbank zu schreiben ist der Verarbeitung geradlinig. Die Verarbeitung kontinuierlicher Ereignis-Ströme impliziert neue Herausforderungen. Das ist insbesondere der Fall, wenn dabei Skalierbarkeit berücksichtigt werden muss, wie wir es mit ScalableMine adressieren. Mit ScalableMine tragen wir zu grundlegenden Arbeiten zum Streaming Process Mining bei, durch den Entwurf und das Benchmarking von skalierbaren Ereignis-Verarbeitungs-Algorithmen und -Architekturen zur Online-Aggregation mehrere Ereignis-Ströme zum Process Mining in (nahezu) Realzeit. Streaming Process Mining muss skalierbar sein um das hohe Volumen und die hohe Geschwindigkeit, mit der Events aus verteilten Quellen produziert werden, zu beherrschen. Mit ScalableMine werden neue Algorithmen und Architekturen für das Streaming Process Mining entworfen und untersucht. Repräsentative, spezifische Benchmarks existieren bisher nicht um die Skalierbarkeit von Ansätzen zum Streaming Process Mining systematisch bewerten zu können. Mit ScalableMine werden solche Benchmarks entworfen, implementiert, evaluiert und für die Gemeinschaft veröffentlicht. Die Synergien in SOURCED werden es möglich machen, die Herausforderungen der Skalierbarkeit im Kontext des Process Mining angemessen zu bewältigen. Beispielsweise werden Abstraktionsmodelle für der verteilte Streaming Process Mining das Benchmarking der Online-Daten-Aggregation unterstützen. Ressourcen-bewusste Process Mining Algorithmen auf Edge- und Cloud-Infrastrukturen werden das vergleichende Bechmarking auf diesen Plattformen unterstützen. Das TinyWorkPlace House wird uns mit realistischen Lastprofilen beim Benchmarking unterstützen.
DFG-Verfahren Forschungsgruppen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung