Detailseite
Projekt Druckansicht

Data Mining mit Linked Open Data (Mine@LOD)

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2013 bis 2018
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 238007641
 
Erstellungsjahr 2017

Zusammenfassung der Projektergebnisse

Das Projekt Mine@LOD untersuchte die Nutzung von Linked Open Data, d.h., großen, mit maschineninterpretierbarer Semantik ausgezeichneter, verknüpfter und im Web frei verfügbarer Datenquellen, als Hintergrundwissen für Data-Mining-Probleme. Es konnte gezeigt werden, dass es möglich ist, einen gegebenen Datensatz automatisch mit Hintergrundwissen anzureichern und damit die Ergebnisse des Data Mining zu verbessern. Im Rahmen des Projektes wurden verschiedene Ansätze entwickelt, um die Anreicherung eines Datensatzes im Data Mining mit zusätzlichen Merkmalen, sogenannten Features, aus Linked Open Data durchzuführen. Dabei gilt es, die graphbasierten Strukturen von Linked Open Data mit den relationalen Strukturen der gängigen Data-Mining-Datensätze zu verbinden. Hier konnte gezeigt werden, dass insbesondere sogenannte Embeddings, d.h., Projektionen (in diesem Falle von Graphen) in einen niedrigdimensionalen Vektorraum, sehr gute Ergebnisse erzielen. Die im Rahmen des Projektes entwickelten Ansätze wurden im Rahmen einer Erweiterung der Data-Mining-Plattform RapidMiner öffentlich zugänglich gemacht. Darüber hinaus wurden mehrere Anwendungsfälle aus verschiedenen Domänen untersucht, u.a. die Interpretation von Statistiken, die Entwicklung von Empfehlungssystemen, z.B. für Bücher, Filme und Medien, sowie die Identifikation umstrittener Themen in verschiedenen Online-Nachrichtenportalen.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung