Project Details
Hybride Methoden- und Systemarchitekturen für heterogene Informationsräume
Applicant
Professor Dr. Stefan Wrobel
Subject Area
Security and Dependability, Operating-, Communication- and Distributed Systems
Term
from 2002 to 2007
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5399759
Für einfach strukturierte, homogene Datenbestände existiert mittlerweile eine Vielzahl von erfolgreichen Analysemethoden aus den Bereichen Statistik, Neuronale Netze, Fuzzy-Systeme und Maschinelles Lernen. Mit diesen Methoden lassen sich in Daten, die in einer einzelnen Tabelle mit numerischen oder symbolischen Werten abgelegt sind, auf unterschiedliche Weise interessante Muster oder funktionale Zusammenhänge entdecken. Trotz der individuell hohen Leistungsfähigkeit dieser Verfahren zeigen sich für die Ziele des Information Mining auf übergeordneter Ebene zwei wichtige Probleme bezogen auf die Integration von Daten und Verfahren. Erstens sind die homogenen Datenbestände, auf denen bisherige Verfahren aufsetzen, nicht der Normalfall bei der Informationssuche. Typischerweise stehen heterogene Datenbestände zur Verfügung, aus denen zunächst von einem Data-Mining-Spezialisten nach Analyse des Anwendungsbereichs ein für die Verfahren geeigneter homogener Datenbestand erstellt werden muß. Dies macht üblicherweise einen Großteil des Arbeitsaufwandes aus. Zweitens ist die optimale Beantwortung einer bestimmten Frage normalerweise nicht durch ein einzelnes Verfahren möglich, sondern erfordert die Kombination der Stärken verschiedener Verfahren mit zur Verfügung stehendem Hintergrundwissen. Auch dies wird üblicherweise von einem Data-Mining-Experten weitgehend manuell und entsprechend arbeitsaufwendig durchgeführt. Die beiden oben geschilderten Probleme können nicht in einem allgemeinen, allumfassenden und für alle möglichen Anbwendungsbereiche verwendbaren Information-Mining-System gelöst werden. Ziel des hier vorgeschlagenen Teilantrags ist es stattdessen, Methoden- und Systemarchitekturen zu entwickeln, die es gestatten, bei der Konstruktion eines Information-Mining-Systems für einen bestimmten Anwendungsbereich das Heterogenitäts- und das Integrationsproblem so effektiv zu lösen, daß mit geringem Zeitaufwand ein dem Sachbereich angepaßtes, benutzerfreundliches und einfach zu wartendes System aufgebaut werden kann. Zum Erreichen dieser Ziele kommen sowohl klassische softwaretechnische als auch methodisch-algorithmische Mittel zum Einsatz. Auf der Ebene der Softwarearchitekturforschung wird das Teilprojekt auf existierende Softwareintegrationsansätze aufsetzen und nachweisen, wie diese im Kontext des Information Mining zu verbinden und zu verändern sind. Zur empirischen Evaluierung wird aus einer existierenden, als Vorarbeit eingebrachten Data-Mining-Plattform ein Softwarebaukasten entwickelt, in den Analyse- und Datenzugriffsmethoden unterschiedlicher Art aus den Vorarbeiten der Antragsteller leicht eingebracht und unter Nutzung von Metadaten zu einer spezialisierten vertikalen Lösung verbunden werden können. Auf der Ebene der Methodenarchitekturforschung wird dies ergänzt durch die Entwicklung eines Architekturkonzeptes für die Integration hybrider Analysmethoden, mit dem die Stärken unterschiedlicher Analysetechniken applikationsspezifisch genutzt werden können. Hier sind bisherige Einzelansätze geeignet zu verallgemeinern und nachzuweisen, mit welchen Verbindungskonzepten eine ausreichende Mächtigkeit und Flexibilität bei einfacher Nutzung erreicht werden kann. Das vorgeschlagene Konzept wird bei der Zusammenstellung geigneter hybrider Methoden für die Anwendungsbereiche des Paketantrages empirisch validiert. Im Gesamtergebnis wird das Teilprojekt also sowohl auf der Ebene der vertikalen Gesamtlösungen als auch auf der Ebene der hybriden Methoden eine fundierte und empirisch validierte Antwort auf die Frage nach geeigneten Softwarearchitekturen für die Intregration hybrider und heterogener Komponenten in Information-Mining-Systemen liefern, die durch entsprechende Prototypen unterfüttert wird.
DFG Programme
Research Grants